收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于缺失特征的文本无关说话人识别鲁棒性研究

陆伟  
【摘要】: 随着说话人身份识别研究的深入,提高实用环境下文本无关说话人识别系统性能鲁棒性已成为当前研究的重点。以高斯混合模型(Gaussian Mixture Model,GMM)为代表的概率统计模型由于可以有效的描述语音特征参数数据集分布,成为文本无关说话人识别领域的主流技术,但基于概率统计模型的说话人识别系统的性能有赖于语音参数数据集,尤其是训练与测试特征数据集的匹配程度。然而,实用环境下由于背景噪声的不同影响、传输通道的多样性,使得测试特征数据集与训练集失配,而导致了系统性能的下降。 本文主要研究减少测试特征集与训练特征集间的失配程度以提高系统性能鲁棒性的方法,根据环境对语音中不同时频段污染程度不同,以及语音信号本身的冗余性,深入研究语音特征参数中受污染严重的缺失特征的筛选和重建方法。 主要研究内容如下: 1.给出了一种基于谱减法语音增强的说话人识别方法,采用改进的谱减法,直接由增强后的语音功率谱提取MFCC参数。在不同信噪比的白噪声和F16战斗机噪声环境的实验表明,谱减法可以在一定程度上提高噪声环境下系统的识别性能。分析并指出了语音增强方法很难得到信号在受噪声污染严重的频段的准确估计,这是限制语音增强方法进一步提高系统鲁棒性的重要原因。 2.根据噪声对语音中不同时频段的影响程度不同,及语音信号本身含有很多冗余信息,给出了一种基于子带信噪比阈值的缺失特征边缘化说话人识别方法,利用子带信噪比将Mel子带特征的各维分量分为可靠特征与缺失特征,只用可靠特征对话者模型计算边缘化输出概率评分。由于将受污染严重的缺失特征丢弃,使系统噪声鲁棒性得到较大提高。在此基础上,又给出了一种基于谱减和缺失特征边缘化相结合的说话人识别方法,使系统性能得到进一步提高。 3.给出了基于Mel子带相关性进行缺失特征重建的方法,根据同一个语音特征类的协方差关系,由说话人可靠特征进行缺失特征重建。提出了两种基于统计分布模型的特征重建方法:基于聚类单高斯模型的缺失特征重建和基于GMM模型的缺失特征重建方法,前一个方法是先聚类,再对子集特征进行高斯分布描述,而后一种方法则将两者合并一起做,从而能更精细地描述出整个特征集的统计分布,以及各个分布间的关系。实验表明,与缺失特征边缘化方法相比,缺失特征重建方法进一步提高了说话人识别系统在噪声环境下的性能。 4.分析发现了基音频率会影响MFCC参数对声道特性的准确描述,进而影响说话人识别系统的性能;由此提出了一种基于平滑幅度谱的SMFCC参数(Smoothing MFCC),实验表明,SMFCC参数性能在整体上优于MFCC参数,在女性说话人数据集上识别性能提高尤其明显,并且具有更好的时间鲁棒性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 何致远,胡起秀,徐光;说话人识别中语音切分算法的研究[J];计算机工程与应用;2003年06期
2 覃爱娜,韩华;说话人识别技术及其在工厂自动控制系统中的应用[J];长沙电力学院学报(自然科学版);2003年02期
3 杨海燕,杨斌,景新幸;说话人识别技术在智能家居中的应用[J];电声技术;2004年05期
4 王晶晶,陈中柱,薛文涛,江红英;一种与文本有关的说话人识别系统设计与实现[J];计算机仿真;2004年06期
5 戴红霞,赵力;采用帧概率变换的与文本无关说话人识别系统的实现[J];电声技术;2004年09期
6 叶蕾,方鹏,杨震;基于因特网的说话人识别技术研究[J];南京邮电学院学报;2004年03期
7 孙林慧,叶蕾,杨震;说话人识别中测试时长与识别率关系研究[J];计算机仿真;2005年05期
8 陆小珊,王俊法,田岚;音高特征在说话人识别中的可分性及应用研究[J];山东大学学报(工学版);2005年04期
9 芮贤义,俞一彪;基于小波变换的鲁棒型特征提取及说话人识别[J];电路与系统学报;2005年05期
10 刘雅琴,杜海明;基于矢量量化的说话人识别[J];洛阳师范学院学报;2005年05期
11 陈立伟;赵春晖;姜海丽;;一种基于混合神经网络的说话人识别系统[J];哈尔滨工程大学学报;2005年06期
12 杨彦;赵力;;一种改进的模糊C-均值聚类算法在说话人识别中的应用[J];电声技术;2006年01期
13 包永强;赵力;邹采荣;;采用归一化补偿变换的与文本无关的说话人识别[J];声学学报;2006年01期
14 戴红霞;赵力;;考虑性别差异的与文本无关说话人识别系统的实现[J];电声技术;2006年03期
15 刘庆辉;姚鸿勋;;基于唇动的说话人识别技术[J];计算机工程与应用;2006年12期
16 白莹;赵振东;戚银城;王斌;郭建勇;;基于小波神经网络的与文本无关说话人识别方法研究[J];电子与信息学报;2006年06期
17 林琳;王树勋;;基于遗传-模糊聚类的说话人识别方法及其仿真研究[J];系统仿真学报;2006年08期
18 芮贤义;俞一彪;;噪声环境下说话人识别的组合特征提取方法[J];信号处理;2006年05期
19 王书诏;邱天爽;;与文本无关的说话人识别系统的设计[J];电声技术;2006年12期
20 王书诏;邱天爽;;说话人识别研究综述[J];电声技术;2007年01期
中国重要会议论文全文数据库 前10条
1 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
2 孙帆;迟惠生;;循环网络说话人识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 肖剑;欧贵文;;多层前馈神经网络组的文本无关说话人识别[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 张玲华;郑宝玉;杨震;;模糊超椭球聚类算法及其在说话人识别中的应用研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
5 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
6 戴红霞;赵力;;文本无关说话人识别系统的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年
7 陈联武;郭武;戴礼荣;;说话人识别系统中多样训练的应用[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 吴丽丽;;基于仿生模式识别的说话人识别学习模型研究[A];第二届中国科学院博士后学术年会暨高新技术前沿与发展学术会议程序册[C];2010年
10 张晶;董金明;冯文全;;说话人识别系统研究与实现[A];全国第二届信号处理与应用学术会议专刊[C];2008年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年
3 刘镝;说话人识别中信息融合算法的研究[D];北京交通大学;2011年
4 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
5 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年
6 邱政权;在噪声环境下的说话人识别[D];华南理工大学;2007年
7 郭武;复杂信道下的说话人识别[D];中国科学技术大学;2007年
8 钱博;基于汉语元音映射的说话人识别技术研究[D];南京理工大学;2007年
9 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
10 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
中国硕士学位论文全文数据库 前10条
1 王冠星;基于特定说话人识别的门禁系统研究[D];中南大学;2008年
2 王颖;基于小波变换的说话人识别方法研究[D];长春理工大学;2009年
3 何金瑞;说话人识别中的模式匹配方法研究[D];西华大学;2009年
4 赵剑;说话人识别鲁棒性增强研究[D];北京邮电大学;2009年
5 周畅宇;基于支持向量机的说话人识别研究[D];中南大学;2009年
6 王发智;说话人识别方法的研究[D];哈尔滨工程大学;2008年
7 于明刚;噪声环境下说话人识别研究[D];哈尔滨工程大学;2008年
8 李轶杰;说话人识别中的信道补偿[D];中国科学技术大学;2009年
9 王佳毅;噪音环境下说话人识别方法[D];上海交通大学;2009年
10 危国腾;基于说话人识别的门禁系统的设计[D];沈阳航空工业学院;2010年
中国重要报纸全文数据库 前3条
1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
3 新城;小声音 大前景[N];计算机世界;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978