收藏本站
《苏州大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

说话人识别及其在噪声环境下的鲁棒性研究

薛峰  
【摘要】: 说话人识别就是通过语音信号来对说话人进行辨认或者确认,根据说话的内容,说话人识别又可分为与文本有关和与文本无关两种方式。说话人识别系统在低噪声、低失真度条件下的性能已经达到令人满意的程度,但在真实的噪声环境下,由于训练模型和测试语音之间的失配,说话人识别系统误识率会急剧上升,因此提高说话人识别系统在噪声环境下的鲁棒性是其从实验室走向实用的关键,也是当前的研究热点。 本文首先详细介绍了说话人识别的基本理论,在此基础上,分别构建了基于VQ和GMM模型的说话人识别系统。在基于VQ的说话人识别系统中,采用了三种不同的码本聚类方法来产生码本,通过比较量化误差、误识率以及计算量综合考虑了三种码本聚类方法的优缺点。在基于GMM模型的说话人识别系统中,评测了LPC、LPCC、MFCC和MCC四种常用特征参数的性能,通过实验,证明了基于人耳听觉特性的特征参数具有较低的误识率和较好的鲁棒性。另外,第三章在介绍HMM模型时,实现了一个汉语四声声调的识别系统。 针对噪声环境下说话人识别系统的鲁棒性较差的这个问题,提出了相对自相关序列小波分解特征提取算法以及基于置信度分析的说话人识别。相对自相关序列对于平稳噪声和慢变噪声具有较好的鲁棒性,因此本文提出了一种对其进行多层小波分解的特征提取算法。在基于置信度分析的说话人识别中,用置信度来度量特征分量的鲁棒性,并提出了一种用于计算MFCC各维分量置信度的方法CBTM,该方法通过一个置信度变换矩阵,估算出经过Mel谱减法处理后的MFCC各维分量的置信度,在此基础上通过对GMM模型的方差加权来减少置信度小的特征分量对输出概率的影响,以此来提高系统的鲁棒性。实验表明,基于特征分量置信度分析的方法可以在基线系统的基础上进一步降低系统的误识率。
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TN912.34

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前1条
1 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年
【参考文献】
中国期刊全文数据库 前9条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 王炜,王炳锡,王波;信道补偿技术的发展及其在说话人识别上的应用[J];电声技术;2004年04期
3 汪峥,连翰,王建军;说话人识别中特征参数提取的一种新方法[J];复旦学报(自然科学版);2005年01期
4 武妍,金明曦,王洪波;基于KL-小波包分析的文本无关的说话人识别[J];计算机工程与应用;2005年04期
5 郭武;王仁华;戴礼荣;;基于基音周期与清浊音信息的梅尔倒谱参数[J];数据采集与处理;2007年02期
6 刘海滨,吴镇扬,赵力,曾毓敏;基于动态单边自相关序列和频率规整线性预测的抗噪声语音识别[J];声学学报;2004年02期
7 俞一彪,王朔中;基于互信息匹配模型的说话人识别[J];声学学报;2004年05期
8 俞一彪;袁冬梅;薛峰;;一种适于说话人识别的非线性频率尺度变换[J];声学学报(中文版);2008年05期
9 芮贤义;俞一彪;;噪声环境下说话人识别的组合特征提取方法[J];信号处理;2006年05期
【共引文献】
中国期刊全文数据库 前10条
1 陈蕴谷;;基于谱减法和经验模式分解的语音增强[J];安庆师范学院学报(自然科学版);2010年01期
2 牛滨;孔令志;罗森林;潘丽敏;郭亮;;基于MFCC和GMM的个性音乐推荐模型[J];北京理工大学学报;2009年04期
3 刘刚;叶大田;;针对汉语声母发音的辅助教师系统的研究[J];北京生物医学工程;2008年02期
4 张志勇;宋阳;;基于嵌入式下的语音机器人的设计与实现[J];长春师范学院学报(人文社会科学版);2008年10期
5 冯哲;孙吉贵;张长胜;王岩;;汉语语音合成的研究进展[J];吉林大学学报(信息科学版);2007年02期
6 张余生;夏秀渝;杨莎;;基于神经网络和卡尔曼滤波算法的说话人识别[J];成都信息工程学院学报;2008年04期
7 冀常鹏;高茉;;嘈杂环境下语音信号端点检测方法研究[J];成都信息工程学院学报;2011年03期
8 吴晶;柳洪轶;;基于子带编码的数字音频水印算法研究[J];长春工程学院学报(自然科学版);2008年03期
9 张东;林晖;;基于子带编码的数字音频隐藏算法研究[J];长春工程学院学报(自然科学版);2009年04期
10 赵立业;;数字助听器系统中的回声消除方法[J];传感器与微系统;2009年11期
中国重要会议论文全文数据库 前10条
1 董静;刘健刚;;英语寂语声信号检测[A];2011'中国西部声学学术交流会论文集[C];2011年
2 李曼曼;杨鸿武;洪宁;杨硕;刘亚丽;;基于EMD的带噪语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
5 方杰;李英;陶泯;;语音信号的一种加权的鲁棒特征参数W_RAS_MFCC[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
6 马治飞;徐望;王炳锡;王兴斌;;一种基于概率模型和倒谱差分的特征补偿算法[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
7 王兴斌;徐望;王炳锡;马治飞;;噪声环境下语音能量的MMSE估计及其在语音识别中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
8 徐小峰;胡央芳;刘守快;郑翔;俞一彪;王宇岭;王庆才;戴云;李道明;;基于VQ算法的病症脉象识别[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
9 杨威明;;基于阈值的小波变换语音增强方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
10 潘欣裕;董兴法;赵鹤鸣;;基于谱能比例加权的谱减法语音增强研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
3 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
4 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
5 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
6 梁彦霞;低速率多带激励线性预测语音编码技术的研究[D];西安电子科技大学;2011年
7 李烨;基于多带激励模型的低速率语音编码技术研究[D];西安电子科技大学;2011年
8 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
9 高翔;浅埋地层探地雷达信号处理与目标识别研究[D];中国海洋大学;2011年
10 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
中国硕士学位论文全文数据库 前10条
1 王萍;语音情感识别研究[D];山东科技大学;2010年
2 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
3 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
4 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
5 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
6 孙大为;数字化单边带水声语音通信系统的研究与实现[D];哈尔滨工程大学;2010年
7 陈伟伟;基于鼾声检测的睡眠呼吸暂停低通气综合症诊断[D];大连理工大学;2010年
8 袁铄;基于小波网络音频信号处理技术[D];大连理工大学;2010年
9 翟文博;基于SIP协议框架的语音通信系统的研究与设计[D];大连理工大学;2010年
10 杨青;手势识别技术的研究[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 黄石磊,武剑虹,匡镜明;用于语音识别的减谱结合RASTA的抗噪声方法[J];北京理工大学学报;2003年05期
2 张贤达,保铮;盲信号分离[J];电子学报;2001年S1期
3 姚志强;周曦;戴蓓蒨;;文本无关说话人识别中一种改进的模型PCA变换方法[J];电子与信息学报;2007年02期
4 郭武;戴礼荣;王仁华;;采用因子分析和支持向量机的说话人确认系统[J];电子与信息学报;2009年02期
5 王让定,柴佩琪;语音倒谱特征的研究[J];计算机工程;2003年13期
6 段晓东,王存睿,王楠楠,刘向东,石丽;一种基于粒子群算法的分类器设计[J];计算机工程;2005年20期
7 郭武;戴礼荣;王仁华;;采用主成分分析的特征映射[J];自动化学报;2008年08期
8 龙艳花;郭武;戴礼荣;;用于SVM说话者确认系统的序列核[J];清华大学学报(自然科学版);2008年S1期
9 郭武;戴礼荣;王仁华;;采用UBM更新量作为支持向量机特征的说话人确认[J];清华大学学报(自然科学版);2008年S1期
10 潘镭;郭武;李轶杰;戴礼荣;;基于本征音因子分析的短时说话人识别[J];数据采集与处理;2009年04期
中国博士学位论文全文数据库 前1条
1 胡郁;语音识别中基于模型补偿的噪声鲁棒性问题研究[D];中国科学技术大学;2009年
中国硕士学位论文全文数据库 前1条
1 陈良柱;采用遗传算法的码本设计及说话人识别[D];大连理工大学;2008年
【二级参考文献】
中国期刊全文数据库 前10条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 付强,易克初;语音信号的Bark子波变换及其在语音识别中的应用[J];电子学报;2000年10期
3 张玲华;郑宝玉;杨震;;基于语音谐波结构的鲁棒特征参数及其在说话人识别中的应用[J];电子与信息学报;2006年10期
4 邵央,刘丙哲,李宗葛;基于MFCC和加权矢量量化的说话人识别系统[J];计算机工程与应用;2002年05期
5 姚文冰,姚天任,韩涛;稳健语音识别技术研究[J];计算机工程与应用;2002年07期
6 徐义芳,张金杰,姚开盛,曹志刚,王勇前;语音增强用于抗噪声语音识别[J];清华大学学报(自然科学版);2001年01期
7 俞一彪,赵鹤鸣,周旭东;语音识别浏览器VoiceIE设计与实现[J];数据采集与处理;2002年01期
8 侯风雷,王炳锡;基于支持向量机的说话人辨认研究[J];通信学报;2002年06期
9 赵铮,侯伯亨;基于小波变换说话人识别技术的研究[J];西安电子科技大学学报;2000年04期
10 岳喜才,伍晓宇,郑崇勋;用神经阵列网络进行文本无关的说话人识别[J];声学学报;2000年03期
【相似文献】
中国期刊全文数据库 前10条
1 马建,郭建东;说话人识别技术研究[J];福建电脑;2005年01期
2 林平澜;王仁华;;动态HMM及其在说话人识别中的应用[J];信号处理;1993年04期
3 周静芳,陈一宁,李科,刘加;基于高斯语音滤波的稳健文本无关说话人识别[J];计算机工程;2005年02期
4 邓浩江,王守觉,邢藏菊,李倩;基于聚类统计与文本无关的说话人识别研究[J];电路与系统学报;2001年03期
5 王炜,王炳锡,王波;信道补偿技术的发展及其在说话人识别上的应用[J];电声技术;2004年04期
6 余华,赵力,吴镇扬;基于FVQ的说话人识别系统的DSP实现[J];电声技术;2004年08期
7 廖贵成,罗文广;一种基于说话人识别技术的自动音量控制系统[J];桂林电子工业学院学报;2004年06期
8 韩雁,陈利华;说话人计算机识别系统的设计与实现[J];浙江大学学报(工学版);2001年02期
9 吴晓娟,韩先花,聂开宝;模糊C-均值(FCM)聚类法与矢量量化法相结合用于说话人识别[J];电子与信息学报;2002年06期
10 单进;;说话人识别技术研究[J];科技资讯;2010年21期
中国重要会议论文全文数据库 前10条
1 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
2 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
3 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
5 侯丽敏;谢娟敏;;共振峰瞬时频率特征用于说话人识别[A];第九届中国语音学学术会议论文集[C];2010年
6 周静芳;陈一宁;刘润生;;一种新的说话人识别信道补偿技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
7 吴志强;陈珂;迟惠生;;语音识别技术与说话人识别技术的结合——文本无关说话人识别的另一种方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
10 罗海风;龙长才;;多话者环境下说话人辨识听觉线索研究[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
中国重要报纸全文数据库 前10条
1 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
2 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
3 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
4 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
5 新城;小声音 大前景[N];计算机世界;2006年
6 本报记者 王璐;科大讯飞:挖掘“说话”技术的商机[N];上海证券报;2008年
7 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
8 陈泰 记者 吴长锋;安徽隆起创新人才高地[N];科技日报;2009年
9 赵海霞;语音识别能否助科大讯飞实现腾飞之梦?[N];通信信息报;2008年
10 记者 郑千里报道;我国生物识别技术研究获得进展[N];科技日报;2001年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
3 王琳琳;说话人识别中的时变鲁棒性问题研究[D];清华大学;2013年
4 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
5 方远香;基于音素分类的短语音说话人识别[D];清华大学;2012年
6 蒋晔;基于短语音和信道变化的说话人识别研究[D];南京理工大学;2013年
7 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年
8 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年
9 游大涛;基于听觉机理的鲁棒特征提取及在说话人识别中的应用[D];哈尔滨工业大学;2013年
10 张冰;人类听觉信息处理机制的心理物理学研究[D];华中科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
2 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年
3 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
4 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
5 潘鹏;会议室环境下基于音频视频信息融合的多说话人识别[D];兰州理工大学;2011年
6 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
7 徐良军;基于语音信号时变特性的说话人识别[D];苏州大学;2010年
8 陈文翔;面向OPHONE手机的说话人识别技术移植研究[D];浙江大学;2011年
9 徐海华;说话人识别方法及其系统的应用开发研究[D];华中科技大学;2004年
10 陈强;基于GMM的说话人识别系统研究与实现[D];武汉理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026