收藏本站
《安徽大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于HTK的汉语连续语音识别系统的设计与实现

饶耀全  
【摘要】:语音识别最直接的目的是让计算机听懂人说的话。经过半个多世纪的发展,语音识别理论已趋近成熟。大量的实验结果和实践操作证明,日前很多语音识别算法和识别模型非常有效。语音识别技术已被广泛应用于各行各业中。本文主要探究了语音识别理论在汉语连续语音识别中的应用。 本文先介绍了语音识别系统的基本流程,语音信号处理的基本理论并且重点探讨了端点检测、特征参数提取的方法和原理。然后再从以下两方面对汉语连续语音识别的方法、原理进行深入的阐述: 一方面从模式识别的研究角度,探讨了汉语语音的发音特点,提取了适合汉语语音识别的特征参数,训练了相应的语音识别模型,并且建立了汉语连续语音识别实验平台。本文基于隐马尔可夫模型(HMM)的连续语音训练和识别算法理论,结合美尔频率倒谱系数(MFCC)提取技术,单音素HMM建模技术,基于上下文相关的三音素HMM建模技术以及基于维特比算法的识别技术等一系列技术,利用隐马尔可夫模型工具箱(HTK)构建了基于HTK的连续语音识别实验平台。实验结果表明,随着HMM从单音素建模到三音素建模的转换,测试语句在语句级和字词级的识别率都呈增加的趋势,捆绑三音素后识别率达到稳定状态。语句级和字词级的识别率分别由开始的76.00%和90.67%提高到最后的96.00%和98.00%,识别效果非常理想。 另一方面从语音识别软件开发的角度,设计和实现了汉语连续语音识别售票模拟系统。文中先介绍了HTK接口应用程序ATK (An Application Toolkit for HTK)的基本组成和基本原理,接着利用ATK在VS.NET平台上实现了汉语连续语音识别售票模拟系统,最后进行了相应的平台测试。测试结果表明它基本实现一个初级汉语语音识别售票系统的功能。
【学位授予单位】:安徽大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TN912.34

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前1条
1 田犇;基于FPGA孤立词语音识别系统设计与实现[D];武汉理工大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 陈景东,徐波,黄泰翼;一种基于迟滞编码的自动语音端点检测方法[J];电路与系统学报;1996年04期
2 顾良,刘润生;改进汉语数码语音识别中的语音特征提取性能[J];电路与系统学报;1997年04期
3 饶耀全;吴小培;吕钊;;基于HTK的汉语语音售票系统的设计与实现[J];工业控制计算机;2010年10期
4 刘庆升,徐霄鹏,黄文浩;一种语音端点检测方法的探究[J];计算机工程;2003年03期
5 吕霄云;王宏霞;;基于MFCC和短时能量混合的异常声音识别算法[J];计算机应用;2010年03期
6 周强,张伟,俞士汶;汉语树库的构建[J];中文信息学报;1997年04期
7 李春,王作英;基于语音学分类的汉语三音子识别单元的算法[J];清华大学学报(自然科学版);2003年01期
8 马明,张杰,王建宇,黄志同;语音识别中隐马尔可夫模型初值的估计[J];数据采集与处理;1997年02期
9 石现峰;张学智;张峰;;基于HTK的语音识别系统设计[J];计算机技术与发展;2006年10期
10 刘雅琴;智爱娟;;几种语音识别特征参数的研究[J];计算机技术与发展;2009年12期
中国硕士学位论文全文数据库 前4条
1 张静亚;基于HMM的汉语连续数字语音识别[D];苏州大学;2005年
2 黄湘松;基于HMM噪声背景下的语音识别方法的研究[D];哈尔滨工程大学;2005年
3 马萧;汉语连续语音识别及其在移动机器人导航中的应用[D];西安理工大学;2007年
4 陈磊;带噪环境下的汉语连续语音识别研究[D];安徽大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 相征;朗朗;王静;;基于基音频能值的端点检测算法[J];安徽工程科技学院学报(自然科学版);2008年03期
2 吕军;马晓娜;;汉语孤立词声韵分割算法的研究[J];安徽师范大学学报(自然科学版);2008年03期
3 陈蕴谷;;基于谱减法和经验模式分解的语音增强[J];安庆师范学院学报(自然科学版);2010年01期
4 霍保世;;技术创新人才流动变化的综合预测与控制[J];北京交通大学学报(社会科学版);2008年03期
5 刘伟洁;詹棠森;;马尔柯夫链在陶瓷产品市场预测与决策中的应用[J];办公自动化;2008年22期
6 王晖;颜靖华;李传珍;蔡娟娟;;音频贝叶斯谐波模型中参数的提取[J];中国传媒大学学报(自然科学版);2007年04期
7 孔令志;罗森林;张冰;王耀威;;纯音乐与语音-音乐混合片段的高准确识别方法[J];北京理工大学学报;2009年01期
8 刘新红;;随机利率下一种家庭联合保险的精算模型[J];北京石油化工学院学报;2007年03期
9 周长锋;韩力群;;概率神经网络在文本无关说话人识别中的应用[J];北京工商大学学报(自然科学版);2007年01期
10 廖成林,孙洪杰;企业流动型客户占有率及其效益的马尔科夫预测[J];商业研究;2003年05期
中国重要会议论文全文数据库 前10条
1 董静;刘健刚;;英语寂语声信号检测[A];2011'中国西部声学学术交流会论文集[C];2011年
2 徐晨;曹辉;;一种语音信号生成的数字模型的研究[A];第二届西安-上海两地声学学术会议论文集[C];2011年
3 李艳娇;杨尔弘;;树库中的歧义组合考察[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 李曼曼;杨鸿武;洪宁;杨硕;刘亚丽;;基于EMD的带噪语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
5 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
6 哈妮克孜·伊拉洪;帕力旦·赛力提尼牙孜;那斯尔江·吐尔逊;吾守尔·斯拉木;;维吾尔人说汉语普通话发音特点的声学分析[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 方杰;李英;陶泯;;语音信号的一种加权的鲁棒特征参数W_RAS_MFCC[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
8 陈伟峰;阮柏尧;张歆奕;;基于One-Pass DTW的说话人识别[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
9 杨威明;;基于阈值的小波变换语音增强方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
10 潘欣裕;董兴法;赵鹤鸣;;基于谱能比例加权的谱减法语音增强研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
3 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
4 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
5 谢春辉;音频隐藏分析方法研究[D];中国科学技术大学;2011年
6 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
7 包桂兰;基于EPG的蒙古语标准音协同发音研究[D];内蒙古大学;2011年
8 梁彦霞;低速率多带激励线性预测语音编码技术的研究[D];西安电子科技大学;2011年
9 李烨;基于多带激励模型的低速率语音编码技术研究[D];西安电子科技大学;2011年
10 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
中国硕士学位论文全文数据库 前10条
1 王萍;语音情感识别研究[D];山东科技大学;2010年
2 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
3 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
4 刘继芳;基于计算听觉场景分析的混合语音分离研究[D];哈尔滨工程大学;2009年
5 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
6 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
7 孙大为;数字化单边带水声语音通信系统的研究与实现[D];哈尔滨工程大学;2010年
8 楼佳;基于网络QoS的AMR语音编码算法研究[D];哈尔滨工程大学;2010年
9 陈晶;基于词片网格的语音文档主题分类[D];哈尔滨工程大学;2010年
10 陈伟伟;基于鼾声检测的睡眠呼吸暂停低通气综合症诊断[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前5条
1 任杰;;语音识别技术概述[J];大众科技;2010年08期
2 袁正午;肖旺辉;;改进的混合MFCC语音识别算法研究[J];计算机工程与应用;2009年33期
3 孔维功;张国杰;张效军;;MFCC中DCT结构的设计与实现[J];计算机工程;2009年05期
4 冯宏伟;薛蕾;;基于HMM和新型前馈型神经网络的语音识别研究[J];计算机工程与设计;2010年24期
5 李宏梅;伍小芹;;有关语音识别技术的研究[J];现代电子技术;2010年08期
中国博士学位论文全文数据库 前2条
1 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
2 王峰;美尔音级轮廓特征在音乐和弦识别算法中的应用研究[D];太原理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 段薇;粒子群优化矢量量化算法在DHMM语音识别中的应用[D];太原理工大学;2011年
2 周慧芳;基于HMM的嵌入式语音识别系统的研究[D];广东工业大学;2011年
3 张延盛;孤立词语音识别算法研究及DSP实现[D];南京信息工程大学;2011年
4 文林;基于改进MFCC的语音识别系统研究及设计[D];中南大学;2011年
5 张何俊彦;基于NiosⅡ的语音识别与AC3音频解码系统设计[D];电子科技大学;2011年
6 陈兰;量子智能算法及其在语音识别中的应用[D];南京邮电大学;2011年
7 段万新;抗噪语音识别系统研究与实现[D];成都理工大学;2011年
8 黄湘松;基于HMM噪声背景下的语音识别方法的研究[D];哈尔滨工程大学;2005年
9 谢秋云;基于FPGA的语音识别技术研究[D];江苏大学;2007年
10 李星星;基于HMM的汉语语音关键词检测研究与实现[D];武汉理工大学;2009年
【二级参考文献】
中国期刊全文数据库 前10条
1 张春涛,吴善培;连接数字语音识别[J];北京邮电大学学报;1997年04期
2 李晶皎,孙杰,张俐,姚天顺;语音识别中HMM与自组织神经网络结合的混合模型[J];东北大学学报;1999年02期
3 陈景东,徐波,黄泰翼;一种基于迟滞编码的自动语音端点检测方法[J];电路与系统学报;1996年04期
4 顾良,刘润生;改进汉语数码语音识别中的语音特征提取性能[J];电路与系统学报;1997年04期
5 顾良,刘润生;汉语数码语音识别:发展现状、难点分析与方法比较[J];电路与系统学报;1997年04期
6 关存太,陈永彬,吴伯修;HMM语音识别模型与一种修正训练算法[J];东南大学学报;1994年01期
7 林立;朱杰;;基于HTK实时中文语音路名查询系统的设计和实现[J];电子测量技术;2008年03期
8 陈磊;吴小培;吕钊;;基于线性预测与归一化互相关的基音检测[J];电子测量技术;2009年10期
9 于拾全,景新幸,刘志国;关键词检出技术在家庭语音智能控制系统中的应用[J];电子工程师;2005年02期
10 何强,张歆奕,张有为;基于定点DSP的实时语音命令识别模块[J];电子技术应用;2000年07期
中国重要会议论文全文数据库 前2条
1 郑方;吴文虎;方棣棠;;汉语语音听写机中的语音识别基元[A];第四届全国人机语音通讯学术会议论文集[C];1996年
2 温源;侯震;李明;王之禹;俞铁城;;Mel刻度上非均匀分布滤波器组在MFCC参数提取中的应用[A];第六届全国人机语音通讯学术会议论文集[C];2001年
中国硕士学位论文全文数据库 前6条
1 谢磊;连续语音识别中声学模型的建立[D];西北工业大学;2002年
2 陈荔龙;连续语音识别搜索算法的研究与应用[D];西北工业大学;2002年
3 黄湘松;基于HMM噪声背景下的语音识别方法的研究[D];哈尔滨工程大学;2005年
4 包世恩;蒙古语非特定人大词汇量连续语音识别系统的研究与实现[D];内蒙古大学;2005年
5 马萧;汉语连续语音识别及其在移动机器人导航中的应用[D];西安理工大学;2007年
6 胡益平;基于GMM的说话人识别技术研究与实现[D];厦门大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 王仕超;;基于HTK的语音识别的语料搜集与语言模型[J];硅谷;2010年20期
2 马明,张杰,王建宇,黄志同;语音识别中隐马尔可夫模型初值的估计[J];数据采集与处理;1997年02期
3 贲俊,余小清,万旺根;基于音素的非特定人英语命令词识别算法研究[J];信号处理;2002年06期
4 戴经国;语音信号处理技术及应用[J];电脑与信息技术;2000年06期
5 范瑜;语音信号端点检测的程序实现[J];电讯技术;1989年02期
6 程庆祥;;语音识别电路简介[J];家电科技;1990年02期
7 王磊;;语音识别中的情感信息分析[J];互联网天地;2008年04期
8 战普明,王作英,陆大 ;语音识别隐马尔可夫模型的改进[J];电子学报;1994年01期
9 李晓霞,王东木,李雪耀;语音识别技术评述[J];计算机应用研究;1999年10期
10 张会清,于洪珍;语音识别及自组织映射神经网络的应用[J];计算机工程与应用;2002年19期
中国重要会议论文全文数据库 前10条
1 马晓川;刘冬;赵荣椿;;孤立短语隐马尔可夫模型自动建模软件的实现[A];第四届全国人机语音通讯学术会议论文集[C];1996年
2 靳慧龙;;基于DSP的电视语音拨号遥控技术[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
3 赵海滨;王宏;闻绍飞;;嵌入式语音识别控制机械手的系统设计[A];第二届全国信息获取与处理学术会议论文集[C];2004年
4 茹海峰;殷业;;基于与图像相结合的语音端点检测方法研究[A];第三届全国信息获取与处理学术会议论文集[C];2005年
5 朱杰;韦晓东;;采用HMM模型方法进行语音信号的端点检测[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
6 张化云;关存太;陈显治;;基于听觉感知的噪声环境语音识别[A];第四届全国人机语音通讯学术会议论文集[C];1996年
7 杨大利;徐明星;吴文虎;;噪音环境下的语音识别研究概述[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
8 陈立伟;赵春晖;;一种抗噪声语音识别系统的设计[A];第二届全国信息获取与处理学术会议论文集[C];2004年
9 刘志敏;吴玺宏;甄斌;迟惠生;;关于外周听觉模型中语音信号处理的分帧问题[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
10 李苇营;易克初;胡征;;用神经预测器改进HMM进行语音识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年
中国重要报纸全文数据库 前10条
1 本报记者 刘学习;认准语音识别的“内核”[N];计算机世界;2002年
2 中国科学院声学研究所研究员 俞铁城;解析语音识别的发展现状[N];通信产业报;2004年
3 黄梦;方案商积极切入语音识别市场[N];电脑商报;2006年
4 ;“超人类语音识别”计划[N];中国计算机报;2002年
5 ;Intel涉足语音识别[N];计算机世界;2003年
6 本报记者 艾文;语音识别:IBM继续领跑[N];中国计算机报;2001年
7 小雷;芝麻开门[N];电脑商报;2006年
8 记者 潘治;汽车真能听话[N];新华每日电讯;2002年
9 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年
10 本报记者 钟洪奇;Pattek语音识别产品: 找一条走得通的路[N];计算机世界;2002年
中国博士学位论文全文数据库 前10条
1 李建安;肺动脉灌注低温HTK液对未成熟肺体外循环损伤作用的临床研究[D];北京协和医学院;2010年
2 王霖;改良HTK液灌注对无心跳供体猪心的保护作用[D];中南大学;2011年
3 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
4 孙颖;情感语音识别与合成的研究[D];太原理工大学;2011年
5 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
6 李伟;基于内容的汉语语音检索技术研究与系统实现[D];清华大学;2011年
7 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
8 丁沛;语音识别中的抗噪声技术[D];清华大学;2003年
9 瞿仰;基于声调识别的汉语计算机辅助学习系统研究[D];华东师范大学;2012年
10 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
中国硕士学位论文全文数据库 前10条
1 饶耀全;基于HTK的汉语连续语音识别系统的设计与实现[D];安徽大学;2011年
2 银兵;基于μ’nSP~(TM)处理器的嵌入式语音控制技术研究[D];河南理工大学;2010年
3 章学勇;连续数字语音识别系统的研究与实现[D];天津大学;2006年
4 钟明辉;基于HTK的汉语数码语音识别研究[D];广西师范大学;2008年
5 王坤卿;小词汇量语音识别系统[D];中国石油大学;2010年
6 米日古力·阿布都热素;基于HTK的维吾尔语连续音素识别技术研究[D];新疆大学;2012年
7 李晓雪;基于麦克风阵列的语音增强与识别研究[D];浙江大学;2010年
8 张志霞;语音识别中个人特征参数提取研究[D];中北大学;2009年
9 郭恒飞;基于非特定人车载电器语音集成控制系统的设计与实现[D];合肥工业大学;2011年
10 严乐贫;音视频双模态车载语音控制系统的设计与实现[D];华南理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026