收藏本站
《河海大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于MFCC和GMM的说话人识别系统研究

丁爱明  
【摘要】:说话人识别作为生物认证技术的一种,是根据应用语音波形中反映说话人生理和行为特征语音参数,自动鉴别说话人身份的一种技术。与其它生物识别技术相比,说话人识别具有更为简便,经济及可扩展性良好等众多优势,可广泛应用于电话银行,数据库访问,计算机远程登录,安全验证,控制等领域。正因为说话人识别具有如此广阔的应用前景,国内外许许多多的工作者投身于这一领域的研究中。在众多的说话人识别技术中,本文主要研究了基于Mel频率倒谱系数(Mel-Frequency Cepstrum Coefficients,简称MFCC)和高斯混合模型(Gaussian Mixture Model,简称为GMM)的说话人识别系统。 人的声道响应是反映说话人个性特征的重要的物理量。而语音信号中声道响应是和声门激励信息卷积在一起的。为了从语音信号中得到声道响应就必须对语音信号实现解卷积。本文介绍了对语音信号实现解卷积求取倒谱系数的两种方法:线性预测分析和同态分析处理。通过对语音信号进行解卷,从而获得与声道响应有关的倒谱系数,组成特征向量。 现实生活中人耳是一个比较好的说话人识别系统,而人耳对声音频率的感知却不是线性的。本文通过对人耳听觉的生理和心理特性的分析介绍,提出了利用音调特性来进行倒谱特征提取的方案,即用MEL频率对短时功率谱做频率弯折处理。在这种新的倒谱提取过程中,用符合临界带分布的等效滤波器组来模拟人耳听觉的非线性特性,从而得到了Mel频率倒谱系数(MFCC)。文中详细介绍了提取MFCC倒谱系数的理论基础和实现方案,并与传统的线性预测技术作了比较,实验结果表明这种改进后的倒谱特征提取方法比较有效。 说话人识别中有许多先进有效的识别技术,其中高斯混合模型(GMM)由于性能较好、复杂度小、方法简单,是目前最好的说话人识别算法之一。本文介绍了GMM模型的概念、模型参数的估计以及GMM的识别算法,并通过实验研究分析了GMM模型的阶数对识别性能的影响。 另外,本文还介绍了倒谱系数的动态特征,从MFCC对时间的一阶导数得到了反映倒谱动态特性的ΔMFCC。通过实验验证了动态特征(ΔMFCC)中的确含有有用的说话人个性信息。在原来MFCC倒谱系数的基础上加入ΔMFCC构成更高维的特征向量,并通过实验验证了这种组合特征对提高系统识别性能的有效性。
【学位授予单位】:河海大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TN912.34

手机知网App
【引证文献】
中国期刊全文数据库 前4条
1 蒋永生;张雄伟;闵刚;刘光云;陈功;;基于改进的MFCC战场被动声目标识别[J];弹箭与制导学报;2008年06期
2 蒋永生;闵刚;陈功;刘光云;;离散小波变换在被动声目标识别中的应用[J];军事通信技术;2008年02期
3 黄伟;;基于信息融合的语种识别研究[J];科技传播;2009年Z1期
4 古今;郭立;郑东飞;;一种基于感知特性的鲁棒性语音认证算法[J];中国科学院研究生院学报;2009年04期
中国重要会议论文全文数据库 前1条
1 王心怡;;水下目标辐射噪声听觉特征的提取与识别[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
中国硕士学位论文全文数据库 前10条
1 周翠梅;说话人识别技术的研究与实现[D];大连理工大学;2010年
2 姚建霄;基于STRAIGHT谱的语音识别算法研究[D];五邑大学;2010年
3 覃溪;基于文本无关的说话人识别研究[D];广西师范大学;2007年
4 曾番;噪声环境下说话人识别技术研究[D];兰州理工大学;2008年
5 于燕平;基于小波变换和GMM的病态嗓音特征提取及识别研究[D];广西师范大学;2008年
6 刘珊;水下被动目标语音特征和分形特征提取研究[D];哈尔滨工程大学;2008年
7 刘丽岩;基于MFCC与IMFCC的说话人识别研究[D];哈尔滨工程大学;2008年
8 朱杰;面向短波通信的文本无关说话人辨识研究[D];哈尔滨工程大学;2009年
9 谢春荣;声纹识别技术在司法鉴定中的应用研究[D];厦门大学;2008年
10 杨善茜;说话人识别算法研究与说话人辨认系统实现[D];广西师范大学;2010年
【参考文献】
中国期刊全文数据库 前7条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 赵力,邹采荣,吴镇扬;HMM在说话人识别中的应用[J];电路与系统学报;2001年03期
3 郭春霞,裘雪红;基于MFCC的说话人识别系统[J];电子科技;2005年11期
4 张万里,刘桥;Mel频率倒谱系数提取及其在声纹识别中的作用[J];贵州大学学报(自然科学版);2005年02期
5 朱青松,吴仕明,张海斌;基于高斯混合模型的说话人识别系统[J];黑龙江科技学院学报;2004年02期
6 谷志新,王述洋,田仲富;声纹识别技术中特征语音参数选取的相关问题[J];林业劳动安全;2005年02期
7 谢迎春,于湘珍,刘建平,张卫华;基于多特征有效组合的说话人识别[J];现代电子技术;2005年09期
中国硕士学位论文全文数据库 前5条
1 张晓枫;基于小波变换与GMM的说话人识别研究[D];西安电子科技大学;2002年
2 刘永红;说话人识别系统的研究[D];西南交通大学;2003年
3 王吉林;利用矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究[D];东南大学;2004年
4 张荣强;说话人识别中特征提取的方法研究[D];大连理工大学;2005年
5 谷志新;基于声纹信息的身份认证模式与算法的研究[D];东北林业大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 陈蕴谷;;基于谱减法和经验模式分解的语音增强[J];安庆师范学院学报(自然科学版);2010年01期
2 施俊强,池明敏;基于TMS320C54x DSKplus的实时TCM语音编解码算法的实现[J];半导体技术;2001年08期
3 邓勇,施文康;基于TMS320C50的语音频谱分析仪[J];兵工自动化;2000年03期
4 徐俊晓,谢锋,江建平,莫运明,郑中华;我国12种无尾类的鸣叫特征参数[J];动物学杂志;2005年03期
5 冯成林,吴淑珍;一种噪声环境下的语音识别方法(线性预测误差法)的研究[J];北京大学学报(自然科学版);2000年05期
6 黄新宇,吴淑珍;基于单边自相关线性预测噪声中汉语语音识别[J];北京大学学报(自然科学版);2000年05期
7 刘敬伟,程乾生;基于动态时间规划的基因芯片数据识别[J];北京大学学报(自然科学版);2002年05期
8 段新,黄新宇,吴淑珍;与文本无关的说话人辨认系统中一种新的使用基音周期方法研究[J];北京大学学报(自然科学版);2003年05期
9 王炜,刘峰,吴淑珍;RASTA滤波在语音通信质量客观评价中应用的研究[J];北京大学学报(自然科学版);2003年05期
10 刘惠华,潘建军,周冰,范京;稀疏谱线合成对元音频域信息分布的探讨[J];北京机械工业学院学报;2005年01期
中国重要会议论文全文数据库 前10条
1 郭巧;张立伟;陆际联;;汉语语音信号的端点检测与切分[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
2 张连海;王杰锋;王炳锡;;基于语音多带激励模型的基音周期估计算法研究[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
3 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 牟峰;俞铁城;杨道淳;;新型半波语音编解码的实现[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
5 邹绘华;李双田;;基于频谱斜率约束的变速率语音编码算法研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
6 李灿伟;杨震;;基于DCT的有色噪声消除算法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
7 周珺;范京;刘惠华;;汉语语音音量和语速变化的自适应的调整[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
8 孙海;范京;刘惠华;;汉语连续语音中的单字起止点综合判别的新方法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 朱学勇;刘亚康;杨乐;;一种基于MBE模型的2.4Kbps语音编码器算法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
10 张玲华;杨震;郑宝玉;;一种修正的倒谱公式及其在说话人识别中的应用[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 夏文芳;认知无线电协作频谱感知性能提升方法研究[D];华中科技大学;2010年
3 郑建炜;基于核方法的说话人辨认模型研究[D];浙江工业大学;2010年
4 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
5 付强;语音的参数表示和质量客观评价研究[D];西安电子科技大学;2000年
6 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年
7 钟金宏;基于音节的汉语连续语音声调识别方法研究[D];合肥工业大学;2001年
8 赵瑞珍;小波理论及其在图像、信号处理中的算法研究[D];西安电子科技大学;2001年
9 张文耀;基于匹配跟踪的低位率语音编码研究[D];中国科学院研究生院(软件研究所);2002年
10 许祥滨;抗强多途径干扰的水声数字语音通信研究[D];厦门大学;2003年
中国硕士学位论文全文数据库 前10条
1 李新蕾;金属磁记忆检测机理的试验研究与有限元仿真[D];南昌航空大学;2010年
2 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
3 王萍;语音情感识别研究[D];山东科技大学;2010年
4 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
5 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
6 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
7 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
8 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
9 孙大为;数字化单边带水声语音通信系统的研究与实现[D];哈尔滨工程大学;2010年
10 孙敬武;基于周期图和神经网络船舶运动预报方法研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 郭一博;生物特征识别技术最新动向[J];中国安防产品信息;2004年04期
2 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
3 王炜,刘峰,吴淑珍;RASTA滤波在语音通信质量客观评价中应用的研究[J];北京大学学报(自然科学版);2003年05期
4 周长锋;韩力群;;概率神经网络在文本无关说话人识别中的应用[J];北京工商大学学报(自然科学版);2007年01期
5 任华新,鲜继清;一种改进的模极大值小波域的去噪算法研究[J];重庆邮电学院学报(自然科学版);2005年04期
6 韩一;王国胤;杨勇;;基于MFCC的语音情感识别[J];重庆邮电大学学报(自然科学版);2008年05期
7 林琳;王树勋;王秀丽;;基于DSP开集说话人识别系统的实时实现[J];吉林大学学报(信息科学版);2006年03期
8 段生全,贺振华,黄德济;HHT方法及其在地震信号处理中的应用[J];成都理工大学学报(自然科学版);2005年04期
9 王铁,张国忠,周淑文;基于竞争神经网络的ABS路面辨识[J];东北大学学报;2003年06期
10 朱云芳,戴朝华,陈维荣;小波消噪阈值选取的一种改进方法[J];电测与仪表;2005年07期
中国重要会议论文全文数据库 前1条
1 冯晓亮;于水源;;语音识别中三种基于DTW的模板训练方法的比较[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 衡彤;小波分析及其应用研究[D];四川大学;2003年
2 蒋鹏;小波理论在信号去噪和数据压缩中的应用研究[D];浙江大学;2004年
3 李杰;隐马尔可夫模型的研究及其在图像识别中的应用[D];清华大学;2004年
4 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
5 梁毅雄;基于子空间分析的人脸特征提取及识别研究[D];重庆大学;2005年
6 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
7 林奕琳;基于语音信号的情感识别研究[D];华南理工大学;2006年
8 雷震春;支持向量机在说话人识别中的应用研究[D];浙江大学;2006年
9 姚志强;说话人识别中提高GMM性能方法的研究[D];中国科学技术大学;2006年
10 包永强;噪声环境下说话人识别的研究[D];东南大学;2006年
中国硕士学位论文全文数据库 前10条
1 刘兴立;任意文本的说话人识别系统研究[D];大连理工大学;2000年
2 张晓枫;基于小波变换与GMM的说话人识别研究[D];西安电子科技大学;2002年
3 王金甲;噪声环境下鲁棒性文本自由说话人辨认系统的研究[D];燕山大学;2003年
4 刘永红;说话人识别系统的研究[D];西南交通大学;2003年
5 徐爽;小波分析理论在说话人识别中的应用研究[D];燕山大学;2004年
6 武东坡;震相识别的实时方法研究[D];中国地震局工程力学研究所;2004年
7 王鑫;指纹识别算法研究及其实现[D];南京理工大学;2004年
8 杨磊;心音信号分析与识别算法的研究[D];重庆大学;2004年
9 周静;心音信号分析方法的研究及其分析系统的开发[D];重庆大学;2004年
10 王吉林;利用矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究[D];东南大学;2004年
【二级引证文献】
中国期刊全文数据库 前8条
1 曾番;鹿光;李国宏;;基于小波包分析的战场被动声目标特征提取[J];弹箭与制导学报;2010年02期
2 刘辉;杨俊安;许学忠;;一种改进的隐马尔可夫模型训练方法及其在声目标识别中的应用[J];电路与系统学报;2011年01期
3 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期
4 乔兵;吴庆林;阴玉梅;;语音识别算法的VC++实现[J];光机电信息;2011年04期
5 丁明亮;罗久飞;郭小渝;;单侧声带息肉的声学信号特征[J];重庆理工大学学报(自然科学);2011年08期
6 胡峰松;张璇;;基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J];计算机应用;2012年09期
7 张玉军;杨巨龙;孙大飞;高勇;;小波MFCC和HMM在低空声目标识别中的应用[J];信息与电子工程;2011年06期
8 金银燕;于凤芹;何艳;;基于时频分布与MFCC的说话人识别[J];计算机系统应用;2012年04期
中国硕士学位论文全文数据库 前10条
1 李锦;基于声波的运动车辆行驶状态辨识理论研究[D];南昌航空大学;2010年
2 顾彦飞;说话人识别算法研究及SOPC设计[D];重庆大学;2010年
3 严登凯;声乐中音色与腔体的关系研究[D];中央民族大学;2010年
4 金银燕;基于时频特征的说话人识别研究[D];江南大学;2011年
5 高扬;耳蜗滤波器倒谱特征在语音识别中的应用[D];太原理工大学;2011年
6 陈黎;基于SVM和GMM的说话人辨识方法研究[D];武汉理工大学;2011年
7 周慧芳;基于HMM的嵌入式语音识别系统的研究[D];广东工业大学;2011年
8 史兆印;音频检索技术在数字语音教学系统中的应用与研究[D];南京理工大学;2011年
9 敬晓英;关于若干回归模型的研究[D];长安大学;2011年
10 陆春梅;与文本无关的开集说话人识别技术研究[D];西南交通大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 张玲华,杨震,郑宝玉;基于HMM的说话人辨认系统及其改进[J];电讯技术;2003年06期
3 刘鸣,戴蓓倩,李辉,李霄寒,陆伟;基于离散小波变换和感知频域滤波的语音特征参数[J];电路与系统学报;2000年01期
4 赵力,邹采荣,吴镇扬;HMM在说话人识别中的应用[J];电路与系统学报;2001年03期
5 宁飞,陈频;说话人识别的几种方法[J];电声技术;2001年12期
6 王艳琴,梁钊,蒙山;分布式语音识别的前端处理及相关标准[J];电声技术;2002年05期
7 刘维亭,朱志宇;基于小波网络和HMM的语音识别方法[J];电声技术;2004年11期
8 郭敏,陈健;用DSP实现人工神经网络语音识别[J];电声技术;1996年08期
9 沈亚强;低信噪比语音信号端点检测和自适应滤波[J];电子测量与仪器学报;2001年01期
10 崔桂香,丁晓明;声纹识别技术应用及一些关键问题[J];计算机安全;2004年07期
中国硕士学位论文全文数据库 前1条
1 刘永红;说话人识别系统的研究[D];西南交通大学;2003年
【相似文献】
中国期刊全文数据库 前10条
1 房晔;周亚滨;;基于概率神经网络说话人识别的算法研究[J];电子测量技术;2008年08期
2 李泽;崔宣;马雨廷;陈俊宇;;MFCC和LPCC特征参数在说话人识别中的研究[J];河南工程学院学报(自然科学版);2010年02期
3 陈皓,付中华,赵荣椿;基于G.729编码参数的语音特征及其应用[J];西北大学学报(自然科学版);2005年03期
4 王书诏;邱天爽;;与文本无关的说话人识别系统的设计[J];电声技术;2006年12期
5 谢迎春;;小波变换在说话人识别中的应用研究[J];武警工程学院学报;2009年02期
6 檀蕊莲;;小波消噪在说话人识别系统中的应用[J];科技资讯;2010年09期
7 赵立志;李辉;陈海东;魏士勇;;支持向量机在说话人识别系统中的应用[J];China's Foreign Trade;2011年14期
8 李战明;王贞;;矢量量化与神经网络相结合的说话人识别系统[J];计算机工程与应用;2006年15期
9 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期
10 李姮;胡维平;;基于GMM的说话人识别[J];广西物理;2011年01期
中国重要会议论文全文数据库 前10条
1 张彬桥;;基于主分量分析的说话人特征提取[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
2 许鑫;苏开娜;胡起秀;;几种改进的MFCC特征提取方法在说话人识别中的应用[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 张飞云;盛胜我;;混响声场中语音识别的未来与发展研究[A];2005年声频工程学术交流会论文集[C];2005年
4 赵美泽;王峰;;基于消除混响的语音识别技术研究[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
5 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
6 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
7 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
8 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
10 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
中国重要报纸全文数据库 前10条
1 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
2 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
3 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
4 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
5 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
6 新城;小声音 大前景[N];计算机世界;2006年
7 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
8 沈占锋;遥感影像信息提取与分析[N];计算机世界;2006年
9 王竣;深入开发CAD系统对疾病诊断有重要意义[N];中国医药报;2007年
10 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
中国博士学位论文全文数据库 前10条
1 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
2 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
3 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
4 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
5 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
6 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
7 孙真真;基于光学区雷达目标二维像的目标散射特征提取的理论及方法研究[D];中国人民解放军国防科学技术大学;2001年
8 武子玉;矿物近红外光谱信息提取及应用研究[D];吉林大学;2005年
9 王承;基于神经网络的模拟电路故障诊断方法研究[D];电子科技大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 丁爱明;基于MFCC和GMM的说话人识别系统研究[D];河海大学;2006年
2 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
3 陈卫;基于支持向量机的说话人识别系统研究[D];华北电力大学(河北);2005年
4 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
5 王发智;说话人识别方法的研究[D];哈尔滨工程大学;2008年
6 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
7 蒋晔;基于文本无关的说话人识别技术研究[D];南京理工大学;2008年
8 王秀丽;说话人识别系统中特征提取和端点检测算法研究及系统的DSP实现[D];吉林大学;2006年
9 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
10 覃溪;基于文本无关的说话人识别研究[D];广西师范大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026