收藏本站
《华东师范大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于GMM的说话人语音识别研究与实践

辛全超  
【摘要】: 说话人识别作为语音信号处理技术的一个代表和重要组成部分,近几年来,日益成为当今的一个研究热点,在电子商务、消费、银行等远程客户服务的身份认证,军事安全领域的说话人身份自动检测认证中具有极大的应用价值和广泛的应用前景。它是一种基于生物特征信息的身份识别方法,通过对说话人的语音进行分析,从而对说话人身份做出正确识别和判断的一项研究。依据判别方式的不同(一对多,一对一),说话人识别可以分为说话人辨认和说话人确认。随着交互技术和信息技术的飞速发展,说话人识别开始越来越受到大家的关注。 本论文主要做的工作如下: 首先,本文针对说话人识别的前端处理方面进行了相关研究,得出并实现了一个比较合理的处理算法; 其次,讨论不同语音特征向量的提取方法,最终得出针对说话人识别而言比较合理的特征向量:美尔倒谱系数(MFCC)。在成功提取出MFCC的前提下,讨论了MFCC各维参数对最终结果的贡献; 再次,在识别模型的训练方面,主要研究高斯混合模型的模型训练,在这种训练方法中,主要讨论了最大似然估计算法,期望-最大化算法以及最大模型距离法; 再其次,在性能研究方面,研究了不同高斯混合密度下说话人辨认系统的识别率,认为高斯密度个数的选择与训练语音数据量具有相关性。同时验证了其他其它几个与识别率有关的参数因素与系统性能关系; 最后,搭建了一个说话人识别系统用于试验测试,验证了一些参数对性能的影响,同时使用了多线程并行处理技术,以此缩短识别时间:并提出了一种放大特征向量差距,变换特征向量在特征空间的分布来提升大容量语音库中说话人识别率的方法。
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TN912.34

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 徐欣;李枚亭;;基于频谱包络算法的语音转换研究[J];数字技术与应用;2011年09期
【参考文献】
中国期刊全文数据库 前4条
1 李晶皎,孙杰,姚天顺;语音识别中基于SFCM模糊聚类的矢量量化方法[J];计算机研究与发展;1999年03期
2 邵央,刘丙哲,李宗葛;基于MFCC和加权矢量量化的说话人识别系统[J];计算机工程与应用;2002年05期
3 黄南华,吴亚栋,李治柱;基于特征空间轨迹多模板匹配的说话人识别研究[J];计算机工程;2001年05期
4 杨澄宇,赵文,杨鉴;基于高斯混合模型的说话人确认系统[J];计算机应用;2001年04期
中国博士学位论文全文数据库 前1条
1 包永强;噪声环境下说话人识别的研究[D];东南大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 刘斌,叶青,王文理;基于电力载波通信的低码率语音压缩编码的方法及分析[J];河北大学学报(自然科学版);2002年01期
2 翟俊海;赵文秀;王熙照;;图像特征提取研究[J];河北大学学报(自然科学版);2009年01期
3 徐维典;;一种利用相似度函数来识别励磁涌流的方法[J];湖北电力;2010年01期
4 柴君;赵振东;戚银城;王斌;;基于谱减法的语音端点检测算法[J];华北电力大学学报;2006年03期
5 魏雪梅,张世英;城市需水预测方法研究[J];河北工业大学学报;2003年06期
6 王光艳,张艳,刘颖娜,赵晓群;基于数学形态学的语音基音轨迹平滑新算法[J];河北工业大学学报;2004年06期
7 孙江胜,高振斌,韩月秋;第三代移动通信系统自适应多速率编码技术研究[J];河北工业大学学报;2005年03期
8 龙东;李从清;孙立新;戴士杰;;一种新的基于小波变换的语音消噪方法[J];河北工业大学学报;2008年03期
9 刘长明;任一峰;;语音识别中DTW特征匹配的改进算法研究[J];中北大学学报(自然科学版);2006年01期
10 谭保华,熊健民,刘幺和;基于Nuance平台的语音识别环境设计[J];湖北工学院学报;2004年06期
中国重要会议论文全文数据库 前10条
1 王红霞;田国会;李晓磊;卜范骞;;基于地标信息融合的家庭环境机器人组合导航[A];第二十六届中国控制会议论文集[C];2007年
2 曹爱增;陈月婷;魏军;李金屏;;一种基于EDAs和聚类分析的杂合进化算法[A];第二十六届中国控制会议论文集[C];2007年
3 李鑫;李力争;;基于模板匹配的固态流体流速检测算法[A];第二十七届中国控制会议论文集[C];2008年
4 李潮潮;迟凯;付芳萍;车文刚;赵庆江;;基于模糊聚类的证券价格对公共信息的反应强度划分[A];第二十九届中国控制会议论文集[C];2010年
5 赵庆江;迟凯;付芳萍;李潮潮;车文刚;;基于FCM的模糊时间序列模型及人民币汇率预测[A];第二十九届中国控制会议论文集[C];2010年
6 董静;刘健刚;;英语寂语声信号检测[A];2011'中国西部声学学术交流会论文集[C];2011年
7 李曼曼;杨鸿武;洪宁;杨硕;刘亚丽;;基于EMD的带噪语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
9 郭巧;张立伟;陆际联;;汉语语音信号的端点检测与切分[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
10 张连海;王杰锋;王炳锡;;基于语音多带激励模型的基音周期估计算法研究[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
3 易吉良;基于S变换的电能质量扰动分析[D];湖南大学;2010年
4 陈韶斌;基于知识推理和视觉机理的遥感图像目标识别方法研究[D];华中科技大学;2010年
5 宋清昆;自适应结构优化神经网络控制研究[D];哈尔滨理工大学;2009年
6 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
7 高杰;基于过渡金属的超分子光化学传感器识别生物功能性检测物[D];华东理工大学;2010年
8 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
9 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
10 陶勇;知识辅助的SAR图像目标特性分析与识别研究[D];国防科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
2 王萍;语音情感识别研究[D];山东科技大学;2010年
3 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
4 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
5 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
6 宋晓玥;基于TDPCA与SPIHT的高光谱压缩和降维算法研究[D];哈尔滨工程大学;2009年
7 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
8 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
9 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
10 孙大为;数字化单边带水声语音通信系统的研究与实现[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前4条
1 潘渊;;声音转换及相关技术的研究[J];今日科苑;2010年22期
2 赵义正;;改进GMM谱包络转换性能的语音转换算法研究[J];科学技术与工程;2010年17期
3 张凯;朱立新;赵义正;;基于重训练高斯混合模型的语音转换方法[J];声学技术;2010年01期
4 赵恒;李冬梅;张玉宏;;MATLAB环境下的基于GMM模型的说话人识别系统[J];微计算机信息;2007年31期
中国博士学位论文全文数据库 前1条
1 孙俊;基于激励源及其韵律特征的源—目标说话人声音转换研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前2条
1 刘金凤;基于DSP的语音转换系统研究[D];吉林大学;2006年
2 胡益平;基于GMM的说话人识别技术研究与实现[D];厦门大学;2007年
【二级参考文献】
中国期刊全文数据库 前4条
1 牟晓隆,胡起秀,吴文虎;与文本无关的复合策略说话人辨识系统[J];清华大学学报(自然科学版);1997年03期
2 程利忠,张宪民;基于语音识别的说话人身份辨识系统[J];上海交通大学学报;1998年09期
3 包永强,周晓彦,赵力,邹采荣;人耳对于不同频率成分分离知觉的定量分析[J];声学技术;2004年02期
4 李蕴华;将倒谱参数与基音信息有效结合进行说话人辨认[J];信号处理;2000年01期
【相似文献】
中国期刊全文数据库 前10条
1 辛全超;吴萍;;基于GMM的说话人识别研究与实践[J];计算机与数字工程;2009年06期
2 赵晓伟;孔凡让;王海鸣;龙潜;;基于排列熵和GMM的说话人识别系统[J];机电一体化;2008年10期
3 陈立伟;赵春晖;姜海丽;;一种基于混合神经网络的说话人识别系统[J];哈尔滨工程大学学报;2005年06期
4 陈宝远;姜海鹏;史玲玲;王正;王晓亮;;矢量量化的音频信号类型确认算法的研究[J];哈尔滨理工大学学报;2010年01期
5 李姮;胡维平;;基于GMM的说话人识别[J];广西物理;2011年01期
6 丁艳伟;戴玉刚;;基于VQ的说话人识别系统[J];电脑知识与技术;2008年32期
7 陈俊;盛利元;;基于LSP线谱对参数的GMM说话人识别系统[J];微计算机信息;2010年04期
8 崔国辉,田岚;基于子带处理多分类器融合的说话人识别[J];山东大学学报(工学版);2004年04期
9 胡海清;张歆奕;;应用于说话人识别的AdaBoost GMM算法[J];五邑大学学报(自然科学版);2006年03期
10 陈妮;盛利元;肖小清;袁益民;;基于自适应补偿的文本无关说话人识别[J];计算机仿真;2008年06期
中国重要会议论文全文数据库 前10条
1 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年
2 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
3 王莹;景新幸;杨海燕;;改进EM算法的高斯混合模型在说话人识别中的应用[A];2008年全国声学学术会议论文集[C];2008年
4 许鑫;苏开娜;胡起秀;;几种改进的MFCC特征提取方法在说话人识别中的应用[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
5 黄光远;刘金涛;黄敏;朱月秋;吕昆;;应用数理方程反演方法研究语音识别-Ⅰ[A];第四届全国人机语音通讯学术会议论文集[C];1996年
6 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
7 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
8 石如亮;李弼程;王波;;语音编码对说话人识别系统的影响(英文)[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
9 侯丽敏;谢娟敏;;共振峰瞬时频率特征用于说话人识别[A];第九届中国语音学学术会议论文集[C];2010年
10 吕成国;冯朝斌;高钰莹;;用于话者识别的MFCC特征提取方法[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
中国重要报纸全文数据库 前10条
1 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
2 中国科学院声学研究所研究员 俞铁城;解析语音识别的发展现状[N];通信产业报;2004年
3 黄梦;方案商积极切入语音识别市场[N];电脑商报;2006年
4 ;Intel涉足语音识别[N];计算机世界;2003年
5 本报记者 刘学习;认准语音识别的“内核”[N];计算机世界;2002年
6 ;“超人类语音识别”计划[N];中国计算机报;2002年
7 本报记者 艾文;语音识别:IBM继续领跑[N];中国计算机报;2001年
8 小雷;芝麻开门[N];电脑商报;2006年
9 记者 潘治;汽车真能听话[N];新华每日电讯;2002年
10 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
3 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
4 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年
5 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年
6 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年
7 吕声;说话人转换方法的研究[D];华南理工大学;2004年
8 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
9 钱博;基于汉语元音映射的说话人识别技术研究[D];南京理工大学;2007年
10 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
中国硕士学位论文全文数据库 前10条
1 辛全超;基于GMM的说话人语音识别研究与实践[D];华东师范大学;2010年
2 丁国梁;耳语音说话人识别的研究[D];苏州大学;2009年
3 庄文;应用VQ和GMM的说话人识别系统研究[D];西华大学;2008年
4 薛峰;说话人识别及其在噪声环境下的鲁棒性研究[D];苏州大学;2009年
5 徐刚;基于泛布尔代数的说话人识别算法的研究[D];武汉理工大学;2006年
6 丁爱明;基于MFCC和GMM的说话人识别系统研究[D];河海大学;2006年
7 袁冬梅;面向说话人识别的非线性频谱变换研究[D];苏州大学;2007年
8 丛菡菡;基于支持相量机的稳键说话人识别[D];电子科技大学;2008年
9 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年
10 张庆芳;基于Mel子带系数的文本无关的说话人识别[D];苏州大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026