收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于特征变换和分类的文本无关电话语音说话人识别研究

解焱陆  
【摘要】: 与文本无关电话语音的说话人身份识别的研究,由于其实用性,成为当今语音识别领域中的热门课题。目前,在这种复杂背景(多环境、多传输通道)下的说话人识别中,以GMM为代表的概率统计模型将话者识别问题转换成对话者语音数据分布的估计问题,取得了较好的识别效果,是当今的主流技术。 然而,概率统计模型对数据有较强的依赖性,在有限训练集下,过多的模型参数将不能保证可靠估计;在训练和测试集失配的情况下,根据训练集估计的模型参数将不适用于测试集。这就限制了模型在复杂的实际环境中的性能。为了进一步提高文本无关说话人识别系统的性能及鲁棒性,本文从特征参数变换和特征空间分类的角度进行了深入研究。 首先,本文针对语音信号测试和训练失配时,难以建立精确的高斯混合模型的问题,提出了一种语音参数的分段概率分布规整方法和一种基于峭度的参数规整方法。两种方法分别在概率分布和峭度的意义上将训练和测试参数都映射到一个较接近于高斯分布的情况,从而更有利于用混合度更低的模型来模拟信号在统计意义上的分布,更为准确的估计GMM的参数,在一定程度上解决了模型过学习的问题,提高了话者确认系统对电话语音长度以及使用环境的鲁棒性。其中,峭度规整方法的变换函数可以针对数据灵活调整,不会因为规整浪费语音数据,因此对短语音的说话人识别取得了更好的效果,对说话人识别技术的实用化有着重要的现实意义。 其次,本文针对电话、手机语音的文本无关说话人确认,语音参数较短的问题,根据语音信号倒谱特征空间中特征矢量分布的非均匀性,以及不同的部分对说话人确认系统所具有不同的贡献和影响,提出了基于特征分类和多子系统SVM融合的CGMM-UBM结构说话人确认系统。实验表明,CGMM-UBM结构能够更为充分的利用训练数据,模型混合度可以较低,并且具有较高的模型训练效率,同时系统也获得了较好的识别性能与噪声鲁棒性,适于短语音情况下的说话人确认。SVM融合器用两类数据进行训练,因此具有良好的区分性,可以细致的反映各个子系统之间的关系,充分发挥了CGMM-UBM结构各个子系统的潜力。SVM融合还对输出评分进行规整,在一定程度上降低了确认系统对确认阈值的依赖性。 以上各方法的实验都取得了良好的效果,证明了方法的有效性。最后,本文针对说话人识别中背景加性噪声的问题,研究了业界在鲁棒性语音识别方面有着较高水准的ETSI DSR AFE标准的两级维纳滤波降噪方法。并提出了一种基于无监督分割的静音检测算法用以替代ETSI DSR AFE标准中维纳滤波的噪声谱估计VAD模块,大大提高了说话人辨认系统对背景加性噪声的鲁棒性。


知网文化
【相似文献】
中国期刊全文数据库 前19条
1 刘倩;李时;;细菌趋药性算法在说话人识别中的应用[J];宿州学院学报;2017年11期
2 赵艳;吕亮;赵力;;基于修正Fukunaga-Koontz变换的说话人识别方法[J];电子器件;2018年04期
3 李为州;杨印根;;说话人识别中基于深度信念网络的超向量降维的研究[J];电脑知识与技术;2017年22期
4 雷震春;万艳红;罗剑;朱明华;;基于Mahalanobis距离的说话人识别模型研究[J];中国语音学报;2016年00期
5 王华朋;李宁;许锋;蔡能斌;;基于元音共振峰特征的法庭说话人识别[J];中国刑警学院学报;2014年02期
6 王华朋;杨军;许勇;;应用似然比框架的法庭说话人识别[J];数据采集与处理;2013年02期
7 檀蕊莲;刘建平;;说话人识别技术的研究进展[J];科技资讯;2007年33期
8 宁飞,陈频;说话人识别的几种方法[J];电声技术;2001年12期
9 曹业敏,侯风雷,王炳锡;说话人识别技术现状与进展[J];河南科技;1998年09期
10 王华朋;杨军;吴鸣;许勇;;基于自适应同源方差控制的法庭自动说话人识别[J];应用科学学报;2014年06期
11 茅正冲;王正创;龚熙;;一种低信噪比下的说话人识别算法研究[J];计算机应用与软件;2014年12期
12 李荟;赵云敏;;特征音方法在说话人识别中的应用[J];计算机系统应用;2013年08期
13 王婧;张良;;自组织特征映射神经网络在说话人识别中的应用[J];科技信息;2009年01期
14 李鹏;马道钧;余菲;;基于聚类分析的说话人识别研究[J];仪器仪表用户;2008年01期
15 戴红霞,赵力;采用帧概率变换的与文本无关说话人识别系统的实现[J];电声技术;2004年09期
16 王仁华;;自动说话人识别[J];信号处理;1991年04期
17 仲伟峰;方祥;范存航;温正棋;陶建华;;深浅层特征及模型融合的说话人识别[J];声学学报;2018年02期
18 茅正冲;涂文辉;;基于分层识别的快速说话人识别研究[J];计算机工程与科学;2018年07期
19 高伟;;基于说话人识别的门禁系统的设计[J];才智;2012年12期
中国重要会议论文全文数据库 前10条
1 孙帆;迟惠生;;循环网络说话人识别[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年
2 肖剑;欧贵文;;多层前馈神经网络组的文本无关说话人识别[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
3 吴玺宏;刘文举;;听神经计算模型及其在抗噪说话人识别中的应用[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 任舒彬;杨莹春;吴朝晖;;面向多通道说话人识别的预处理方法实验研究(类别:声纹鉴定)[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
5 刘大力;赵力;;与文本无关说话人识别系统的性能比较[A];2004年全国物理声学会议论文集[C];2004年
6 张陈昊;郑方;王琳琳;;基于多音素类模型的文本无关短语音说话人识别[A];需将论文集名称修改为“第十二届全国人机语音通讯学术会议(NCMMSC2013)论文集[C];2013年
7 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
8 龙川;景新幸;杨海燕;;矢量量化与协方差矩阵结合的说话人识别方法[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
9 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
10 王波;王炳锡;徐毅琼;;基于多分类器的抗噪声说话人识别系统[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 徐珑婷;基于稀疏分解的说话人识别技术研究[D];南京邮电大学;2017年
2 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年
3 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
4 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
5 侯丽敏;基于非线性理论和信息融合的说话人识别[D];上海大学;2005年
6 雷震春;支持向量机在说话人识别中的应用研究[D];浙江大学;2006年
7 姚志强;说话人识别中提高GMM性能方法的研究[D];中国科学技术大学;2006年
8 包永强;噪声环境下说话人识别的研究[D];东南大学;2006年
9 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年
10 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
中国硕士学位论文全文数据库 前10条
1 王磊;基于小波包变换的说话人识别特征参数提取算法研究[D];湖南大学;2014年
2 方祥;基于多信息融合的说话人识别[D];哈尔滨理工大学;2018年
3 刘宾;藏语安多方言文本相关的说话人识别研究[D];西北师范大学;2018年
4 白璐;语谱图在汉字发音识别与说话人识别中的应用研究[D];东北师范大学;2018年
5 于首杰;说话人识别中基于自动编码机的信道补偿方法研究[D];哈尔滨工业大学;2018年
6 张洪冉;噪声环境下说话人识别的鲁棒性研究[D];南京邮电大学;2018年
7 刘俊坤;基于深度学习和矢量量化的说话人识别研究[D];南京邮电大学;2018年
8 张子慧;基于i-vector的说话人识别的研究[D];内蒙古大学;2017年
9 陈甜甜;基于深度学习的说话人识别研究[D];北京邮电大学;2018年
10 张晶晶;基于DTED-FTRLS和BP神经网络的说话人识别研究[D];安徽大学;2018年
中国重要报纸全文数据库 前2条
1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978