收藏本站
《重庆师范大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

语音识别系统中特征提取和声学建模的研究

赵明明  
【摘要】:语音识别基本过程包括预处理、语音增强和语音消噪、语音分割、各类识别特征的提取、语音识别的声学模型、语音识别的语言学模型等几个部分。本文对上述过程进行了详细介绍,并对特征提取和声学模型进行了重点研究。 本文分析了语音增强和消噪的一般方法,讨论了采用建立实时在线噪声数据库来提升语音增强和消除噪声的思路;介绍了语音识别中端点检测的方法和重要作用。详细归纳了各种特征参数,以及其提取方法和在语音识别中发挥的作用。重点分析了两种对美尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)的改良的特征参数提取方法。一种名为Bark子波美尔频谱倒谱系数(BarkMFCC,BMFCC),它将Bark子波变换嵌入到MFCC参数提取的过程中,比普通MFCC参数更准确的描述语音信号这种快速变化而又短时平稳性信号的频谱特征。另一种名为临频带小波变换美尔频谱倒谱系数(Critical Frequency Band andWavelet Transform MFCC,WMFCC),提取此参数时采用小波变换依照听觉临频带来构建新的更能准确反映人耳听觉的新型虑波器组来代替原来滤波器组的方法,相比MFCC参数的美尔频谱组成的听觉滤波器组,依照听觉临频带构建的小波滤波器组能更好的反映人耳耳蜗的工作机制。在对特征参数提取进行大量研究的基础上,提出了一种新型的特征参数,线性预测残差相位倒谱系数(Linear PredictiveResidual Phase Cepstrum Coefficients,RPCC), RPCC在提取的过程中将残差相位特征以线性叠加的方式与LPCC参数进行融合,改善了线性预测倒谱系数(LinearPredictive Cepstral Coding,LPCC)在反映各语音基元差别的不足,随后的实验证明了此参数的有效性。在声学模型方面,本文详细分析了各型的隐马尔可夫模型。并在分析对比现有的声学模型的基础上,提出了一种新型的声学识别模型,非齐次半连续隐马尔可夫模型(Nonhomogeneous Semi-continuous Hidden Markov Model,NSCHMM)。此模型与标准隐式马尔可夫模型相比,不仅比较准确的描述了观测量,而且改善了对马尔可夫链状态的描述。NSCHMM模型与齐次HMM对每个观测量都用高斯分布完全描述不同,采用特征向量共享的方式描述观测量,简化了模型;与齐次HMM采用几何分布描述内部隐含状态的段长分布不同,采用高斯分布来描述内部隐含状态的段长分布。通过对语音资料的驻留概率统计表明,语音的驻留概率并非几何分布形式,而是更接近于高斯分布、均匀分布等。因此采用高斯分布来描述内部隐含状态段长分布的NSCHMM相比用几何分布的齐次HMM更适合用于语音识别。在随后的与齐次HMM的连续语音识别实验中也证明了此模型的有效性。考虑到HMM类模型对易混语音识别存在先天缺陷,文章的最后也讨论了NSCHMM模型与支持向量机组成两级决策语音识别系统的思路。并分析了NSCHMM与基于置信度和采用改进的动态时间规整有向无环一分多支持向量机(DWT支持向量机)的联合作为声学识别模型的应用前景。
【学位授予单位】:重庆师范大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TN912.34

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 张静亚;基于CHMM的高性能连续数字语音识别算法[J];常熟理工学院学报;2005年02期
中国硕士学位论文全文数据库 前1条
1 蔡魁杰;基于支持向量机的汉语语音端点检测和声韵分离[D];哈尔滨工程大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 茅力群;;利用HMM提取连续语音中的口型信息[J];微计算机信息;2006年02期
2 王宏;郭艳丽;贾新民;;基于HMM的孤立字识别[J];昌吉学院学报;2006年01期
3 余华,蒋春晖,赵力,吴镇扬;基于TMS320C54XDSP的语音识别装置的研究与实践[J];电气电子教学学报;2004年01期
4 古丽拉·阿东别克,于迎霞;基于LPC美尔倒谱特征的带噪语音端点检测[J];电声技术;2004年02期
5 余华,赵力,吴镇扬;基于FVQ的说话人识别系统的DSP实现[J];电声技术;2004年08期
6 严素清,黄冰;传声器阵列的声源定位研究[J];电声技术;2004年12期
7 邝航宇,张军,韦岗;一种基于检测元音的孤立词端点检测算法[J];电声技术;2005年03期
8 董璐,忻蔚然,叶敦范;基于小波变换的音频信号基频提取[J];电声技术;2005年06期
9 卢珞先,刘建辉,黄涛;两种改进型LPC特征参数对语音识别效果的影响[J];电声技术;2005年10期
10 周洁,赵力,邹采荣;情感语音合成的研究[J];电声技术;2005年10期
中国重要会议论文全文数据库 前2条
1 杨威明;;基于阈值的小波变换语音增强方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
2 魏臻;张景达;陆阳;;嵌入式系统中语音增强改进算法的研究[A];2007'中国仪器仪表与测控技术交流大会论文集(一)[C];2007年
中国博士学位论文全文数据库 前10条
1 冯长建;HMM动态模式识别理论、方法以及在旋转机械故障诊断中的应用[D];浙江大学;2002年
2 郑建明;基于HMM的多特征融合钻头磨损监测技术的研究[D];西安理工大学;2004年
3 叶大鹏;基于2D-HMM的旋转机械故障诊断方法及其应用研究[D];浙江大学;2004年
4 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
5 李波;语音转换的关键技术研究[D];国防科学技术大学;2005年
6 陈强;高速公路交通流特征参数被动声学检测技术研究[D];吉林大学;2005年
7 林奕琳;基于语音信号的情感识别研究[D];华南理工大学;2006年
8 宁更新;抗噪声语音识别新技术的研究[D];华南理工大学;2006年
9 马晓红;传声器阵列语音增强中关键技术的研究[D];大连理工大学;2006年
10 郭武;复杂信道下的说话人识别[D];中国科学技术大学;2007年
中国硕士学位论文全文数据库 前10条
1 郑普亮;基于二次时频分布的语音信号分类与验证[D];华北电力大学(北京);2006年
2 于吉龙;车载语音识别系统设计开发[D];吉林大学;2007年
3 陶智;基于人耳听觉掩蔽效应的语音增强的研究[D];苏州大学;2003年
4 王青;基于神经网络的汉语语音情感识别的研究[D];浙江大学;2004年
5 修国浩;基于WD/HMM的语音识别算法研究[D];燕山大学;2004年
6 徐爽;小波分析理论在说话人识别中的应用研究[D];燕山大学;2004年
7 朱君波;PCA在语音检测中的应用研究[D];浙江工业大学;2004年
8 高瑞华;多种预处理方法在语音检测中应用效果的比较研究[D];浙江工业大学;2004年
9 李静;基于骨导信号的语音重构技术[D];西北工业大学;2004年
10 李强;基于DSP的EVRC声码器实现与优化[D];西北工业大学;2004年
【二级参考文献】
中国期刊全文数据库 前10条
1 魏欧,孙玉芳;基于非监督训练的汉语词性标注的实验与分析[J];计算机研究与发展;2000年04期
2 童学锋,邓刚,柴佩琪;隐马尔可夫模型在脱机手写体汉字识别中的应用[J];计算机应用;2002年10期
3 秦欢,柴佩琪,陈锴;基于小波子带分解的特征参数对语音自动切分的改进[J];计算机应用;2005年06期
4 贺志阳;张玲华;;基于GMM统计参数和SVM的说话人辨认研究[J];南京邮电大学学报(自然科学版);2006年03期
5 李建民,张钹,林福宗;支持向量机的训练算法[J];清华大学学报(自然科学版);2003年01期
6 魏欧,吴健,孙玉芳,sonata.iscas.ac.cn;基于统计的汉语词性标注方法的分析与改进[J];软件学报;2000年04期
7 何振武,丁洪,林良明;一种新的声韵分割的时域方法[J];数据采集与处理;1998年02期
8 闵莉,初正恒,马广韬,吴玉厚;支持向量机的红外目标自动检测与识别[J];沈阳建筑工程学院学报(自然科学版);2004年01期
9 赵姝彦,张雪英,焦志平;基于ZCPA和DHMM的孤立词语音识别系统[J];太原理工大学学报;2005年03期
10 李凌均,张周锁,何正嘉;基于支持向量机的机械故障智能分类研究[J];小型微型计算机系统;2004年04期
中国博士学位论文全文数据库 前1条
1 唐发明;基于统计学习理论的支持向量机算法研究[D];华中科技大学;2005年
中国硕士学位论文全文数据库 前3条
1 陈丽霞;基于声韵母基元的汉语语音识别系统[D];南京理工大学;2005年
2 张徽强;带噪语音信号的端点检测和声韵分离[D];国防科学技术大学;2005年
3 赵高峰;基于小波分析的语音端点检测算法研究[D];太原理工大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 张晴晴;潘接林;颜永红;;混合双语语音识别的研究[J];声学学报;2010年02期
2 田斌;田红心;易克初;;一种结合声学匹配信息的汉语统计语言模型新方法[J];模式识别与人工智能;1999年04期
3 张俊;危韧勇;;基于连续HMM语音识别系统的构建与分析[J];计算机与现代化;2009年10期
4 ;浅谈语音识别系统相关技术[J];可编程控制器与工厂自动化;2005年12期
5 丁玉国,刘加,刘润生;嵌入式系统上的实时语音识别算法[J];数据采集与处理;2005年03期
6 金玮;孙甲松;;汉语语音识别中语言模型的并行优化[J];电声技术;2010年08期
7 曾妮;费洪晓;姜振飞;;基于HTK的特定词语音识别系统[J];计算机系统应用;2011年03期
8 艾伦;王陆;张鸽;;汉语标准普通话水平训练和自动测试系统[J];中国电化教育;2004年07期
9 刘斌;谢凌云;;基于子空间聚类的快速高斯计算[J];计算机工程;2007年03期
10 苏腾荣;吴及;王作英;;基于空间相关性变换的声学模型训练[J];电子与信息学报;2010年04期
中国重要会议论文全文数据库 前10条
1 彭荻;刘刚;郭军;;语音识别系统中上下文相关声学模型建模优化[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
2 黄松芳;吴昊;高勤;吴玺宏;迟惠生;;汉语广播新闻语音的自动识别和标注[A];第八届全国人机语音通讯学术会议论文集[C];2005年
3 岳红强;李成荣;李鹏;;DSP语音交互模块与语音识别系统的优化[A];第八届全国人机语音通讯学术会议论文集[C];2005年
4 崔毓菁;刘刚;;基于HMM的语音识别系统中状态输出概率计算优化算法的研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
5 邵健;韩疆;颜永红;;嵌入式语音识别中一种高效的搜索树构造方法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
6 徐波;黄泰翼;;基于三遍搜索框架的汉语非特定人、连续语音识别[A];第五届全国人机语音通讯学术会议论文集[C];1998年
7 蔡伟建;;人工神经网络理论在语音识别技术中的应用[A];第八届全国信息获取与处理学术会议论文集[C];2010年
8 杨学增;方棣棠;;神经网络用于语音识别初探[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
9 王作英;;非齐次语音识别HMM模型和THED语音识别与理解系统[A];第二届全国人机语音通讯学术会议论文集[C];1992年
10 王承发;赵德彬;金山;苗百利;朱志莹;;语音识别应用中抗噪声干扰方法的初步探讨[A];第二届全国人机语音通讯学术会议论文集[C];1992年
中国重要报纸全文数据库 前10条
1 ;e-t@lk语音识别系统亮相中国[N];国际商报;2000年
2 平远;多语种交谈式语音识别系统[N];北京电子报;2000年
3 北京清华大学电子工程系副教授 刘加 教授 刘润生;让机器听懂我的话[N];科技日报;2001年
4 ;听声音识别嫌疑犯[N];检察日报;2002年
5 清华大学 刘加;识别语音的几种依据[N];计算机世界;2006年
6 中国科学院声学研究所研究员 俞铁城;解析语音识别的发展现状[N];通信产业报;2004年
7 ;终结键盘时代[N];中国计算机报;2001年
8 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年
9 本报记者 陈磊;2008奥运,实现语言交流无障碍[N];科技日报;2006年
10 本报记者 刘学习;认准语音识别的“内核”[N];计算机世界;2002年
中国博士学位论文全文数据库 前10条
1 刘聪;声学模型区分性训练及其在LVCSR系统的应用[D];中国科学技术大学;2010年
2 鄢志杰;声学模型区分性训练及其在自动语音识别中的应用[D];中国科学技术大学;2008年
3 胡郁;语音识别中基于模型补偿的噪声鲁棒性问题研究[D];中国科学技术大学;2009年
4 李小兵;高效简约的语音识别声学模型[D];中国科学技术大学;2006年
5 严可;发音质量自动评测技术研究[D];中国科学技术大学;2012年
6 张峰;基于统计模式识别发音错误自动检测的研究[D];中国科学技术大学;2009年
7 崔志文;多孔介质声学模型与多极源声电效应测井和多极随钻声测井的理论与数值研究[D];吉林大学;2004年
8 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
9 雷鸣;统计参数语音合成中的声学模型建模方法研究[D];中国科学技术大学;2012年
10 徐望;连续语音识别的稳健性技术研究[D];解放军信息工程大学;2006年
中国硕士学位论文全文数据库 前10条
1 赵明明;语音识别系统中特征提取和声学建模的研究[D];重庆师范大学;2012年
2 李伟;放射科语音识别系统中环境自适应技术的研究与实现[D];浙江大学;2013年
3 肖吉;基于有限状态图的语音识别系统的构建[D];清华大学;2011年
4 付维;基于HMM的机器人语音识别系统的研究[D];武汉科技大学;2011年
5 陈成;基于语音包络特征的语音识别系统[D];西安理工大学;2010年
6 李新超;基于单片机的语音识别系统设计及实现[D];华南理工大学;2010年
7 宋阳;基于单片机的语音识别系统软件设计与开发[D];电子科技大学;2011年
8 林艳生;车载多媒体语音识别系统设计[D];辽宁工程技术大学;2011年
9 黄文涛;基于神经网络的嵌入式语音识别系统研究[D];广东工业大学;2012年
10 斯芸芸;嵌入式语音识别系统的设计与实现[D];重庆大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026