收藏本站
《广西师范大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于HTK的汉语数码语音识别研究

钟明辉  
【摘要】: 随着计算机与信息技术的持续发展,语音交互必将成为人机交互的必要手段。语音识别技术经过了近半个世纪的发展,目前已日趋成熟,并得到广泛的应用,但还远不能说完美得没有任何值得研究、值得改进的地方。就算初看起来很简单的汉语数码语音识别,虽然它已经在电话自动拨号、家电产品的遥控、工业控制等领域中开始发挥作用,但是仍然有很大的深入研究空间,以提高识别系统的速度、稳健性和识别率。本文结合隐马尔可夫模型原理,用MATLAB语言编程实现了汉语离散数码语音识别系统;并利用HTK(HMM ToolKit)语音处理工具箱,实现了汉语离散数码和汉语连续数字语音识别系统。 首先,本文介绍了语音识别技术的国内外发展状况,分析了汉语数码,特别是汉语连续数字语音识别中面临的困难,在此基础上阐明了本课题的研究背景和意义。 其次,详细讨论了语音识别系统的基本原理构成模型,介绍了语音信号的数学模型、预处理和特征参数提取等过程,确定了MFCC参数作为识别参数。并讨论了本文语音识别系统采用的隐马尔可夫模型(Hidden Markov Model,HMM),介绍了HMM的定义,三个基本问题以及基本算法等问题。着重讨论了HMM在实际应用中的一些具体问题,通过实验确定了汉语数码语音识别系统的最佳状态数及混合度数。 接着,简单介绍HTK的软件结构及HTK工具包,着重讨论了基于HTK的语音识别系统的搭建过程,通过汉语离散数码,以及连续数字语音识别系统证明识别单元、高斯混合分量的数目,MFCC维数的适当组合可提高系统的正确识别率。 最后对汉语数字语音识别系统的总结及今后工作的展望。
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TN912.34

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前4条
1 张俊如;双模态车载语音指令识别系统在线学习方法[D];华南理工大学;2011年
2 王涛;基于即时通讯软件的智能服务机器人平台的设计与实现[D];华中科技大学;2010年
3 张卓;基于语义扩展的信息抽取技术研究[D];哈尔滨工程大学;2011年
4 严乐贫;音视频双模态车载语音控制系统的设计与实现[D];华南理工大学;2010年
【参考文献】
中国期刊全文数据库 前3条
1 石现峰;张学智;张峰;;基于HTK的语音识别系统设计[J];计算机技术与发展;2006年10期
2 蔡琴;吾守尔·斯拉木;;基于HTK的维吾尔语连续数字语音识别[J];现代计算机;2007年04期
3 尉洪,杨鉴;连接数字串语音识别[J];云南大学学报(自然科学版);2002年04期
中国硕士学位论文全文数据库 前7条
1 沈怡;特定人孤立词汉语识别系统的研究[D];南京气象学院;2004年
2 肖江南;汉语孤立词识别系统开发与研究[D];广西师范大学;2004年
3 卞洁;非特定人孤立词语音识别系统若干关键技术的研究[D];大连理工大学;2005年
4 侯周国;基于HMM的汉语数字语音识别系统研究[D];湖南师范大学;2006年
5 章学勇;连续数字语音识别系统的研究与实现[D];天津大学;2006年
6 赫连浩博;汉语语音预处理及孤立词识别方法研究[D];山东大学;2007年
7 蔡琴;基于HTK的维吾尔语连续数字语音识别研究[D];新疆大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 鞠训光;宋农村;张三友;姜英姿;;基于C#和MATLAB Server的数据挖掘Web教学演示系统[J];徐州工程学院学报(自然科学版);2010年04期
2 李浩;一种易于实现的线性预测方案[J];彭城职业大学学报;2003年02期
3 刘剑武;朱映映;宋娜;;融合音频特征的比赛场地主颜色聚类算法[J];莆田学院学报;2010年05期
4 田浩;;数字音响关键技术研究[J];湖北第二师范学院学报;2010年08期
5 肖正安;;基于MATLAB分析语音信号频域特征[J];湖北第二师范学院学报;2011年08期
6 张颖;王钢;安然;;方言语料数据库管理系统设计[J];新乡学院学报(自然科学版);2008年03期
7 刘彤;噪声环境下的汉语语音识别技术[J];情报指挥控制系统与仿真技术;2001年09期
8 邓军;夏林平;卢礼华;张志文;;车联网在自主品牌汽车中的技术可行性研究[J];汽车零部件;2012年02期
9 钟建;戴卫国;;基于隐马尔可夫模型的舰船辐射噪声目标识别[J];青岛大学学报(自然科学版);2006年02期
10 杜军;;基于稀疏编码的语音增强方法[J];青岛大学学报(自然科学版);2009年01期
中国重要会议论文全文数据库 前10条
1 边红昌;程德福;祁玉林;张坤;;基于DSP和ZigBee无线智能语音控制系统设计[A];第二十六届中国控制会议论文集[C];2007年
2 陆汝华;杨胜跃;樊晓平;;基于CGHMM的轴承故障音频信号诊断方法[A];第二十六届中国控制会议论文集[C];2007年
3 张利军;岳宏达;雷正林;;基于短时傅立叶变换的人工电子耳蜗言语处理器设计[A];第二十七届中国控制会议论文集[C];2008年
4 董静;刘健刚;;英语寂语声信号检测[A];2011'中国西部声学学术交流会论文集[C];2011年
5 田业;贾珈;江建博;蔡莲红;;汉语普通话声调增强算法的研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
6 李曼曼;杨鸿武;洪宁;杨硕;刘亚丽;;基于EMD的带噪语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 刘博;杨鸿武;甘振业;李曼曼;孙红英;;面向藏语机读音标SAMPA-T的字音转换[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
9 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
10 张瑞华;陈国华;颜伟文;陈清光;;基于VC与MATLAB接口技术的LPG储罐重大事故动态模拟评价系统软件开发与应用[A];第十四届海峡两岸及香港、澳门地区职业安全健康学术研讨会暨中国职业安全健康协会2006年学术年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
3 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
4 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
5 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
6 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
7 郑永;基于时栅传感器的精密蜗轮副动态检测技术研究[D];合肥工业大学;2011年
8 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
9 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
10 高二中;对话电话语音的话者确认研究[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 李锦;基于声波的运动车辆行驶状态辨识理论研究[D];南昌航空大学;2010年
2 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
3 王萍;语音情感识别研究[D];山东科技大学;2010年
4 陈斌;PJR-2X型喷浆机器人交互式虚拟样机系统开发[D];山东科技大学;2010年
5 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
6 张增银;基因表达式编程与HMM融合技术应用研究[D];广西师范学院;2010年
7 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
8 曹唯伟;基于拼音编码的水下语音通信发射端的设计与实现[D];哈尔滨工程大学;2010年
9 刘继芳;基于计算听觉场景分析的混合语音分离研究[D];哈尔滨工程大学;2009年
10 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 张东礼,汪东升,郑纬民;基于VSM的中文文本分类系统的设计与实现[J];清华大学学报(自然科学版);2003年09期
2 林建兵;邹金安;;基于应用层的企业智能即时通讯系统的JAVA实现[J];西华大学学报(自然科学版);2009年03期
3 胡光锐,王昀;一种抗噪声语音识别方法[J];上海交通大学学报;1995年03期
4 王晓平;郝玉峰;付德刚;袁春伟;;计算机唇读研究进展[J];数据采集与处理;2007年03期
5 吕国云;赵荣椿;蒋冬梅;H. Sahli;樊养余;W. Verhelst;;基于BTSM-LDA的口形动态特征及多流异步音视频语音识别[J];数据采集与处理;2008年04期
6 饶文碧;柯慧燕;;Web文本分类技术研究及其实现[J];计算机技术与发展;2006年03期
7 石现峰;张学智;张峰;;基于HTK的语音识别系统设计[J];计算机技术与发展;2006年10期
8 陈磊;;计算机视觉类库OpenCV在VC中的应用[J];微计算机信息;2007年12期
9 王东,蒙山,张有为;汉语听觉视觉语音识别(CAVSR)双模态数据库的建立与结构[J];五邑大学学报(自然科学版);2001年01期
10 张永强;乔世权;孙亮;;企业级即时通讯系统的设计与实现[J];陕西科技大学学报;2008年01期
中国博士学位论文全文数据库 前2条
1 王坚;语音识别中的说话人自适应研究[D];北京邮电大学;2007年
2 钱铁云;关联文本分类关键技术研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 刘金福;基于关键词检出的说话人自适应技术研究[D];解放军信息工程大学;2004年
2 包世恩;蒙古语非特定人大词汇量连续语音识别系统的研究与实现[D];内蒙古大学;2005年
3 崔双喜;语音识别中说话人自适应技术的研究与实现[D];燕山大学;2006年
4 侯周国;基于HMM的汉语数字语音识别系统研究[D];湖南师范大学;2006年
5 毕力格图;基于HMM建模的蒙古语连续语音识别系统的研究与实现[D];内蒙古大学;2006年
6 海宇峰;基于形式概念分析的用户查询词扩展方法的研究[D];西华大学;2007年
7 于吉龙;车载语音识别系统设计开发[D];吉林大学;2007年
8 汤升庆;车载语音识别的应用设计[D];武汉理工大学;2007年
9 陈满;线性子空间人脸识别方法的研究与仿真[D];南京林业大学;2007年
10 叶鸿敏;基于二代小波图像处理的快速人脸识别研究[D];浙江工业大学;2007年
【二级引证文献】
中国博士学位论文全文数据库 前2条
1 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
2 梁亚玲;基于单视觉通道唇读系统的研究[D];华南理工大学;2011年
中国硕士学位论文全文数据库 前2条
1 张俊如;双模态车载语音指令识别系统在线学习方法[D];华南理工大学;2011年
2 陈浩球;嵌入式双模态车载语音指令识别系统的研制[D];华南理工大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 赵庆卫,王作英;利用段长信息的改进连续语音识别算法[J];清华大学学报(自然科学版);1997年10期
2 吴华,徐波,黄泰翼;基于三音子模型的语料自动选择算法[J];软件学报;2000年02期
3 王跟东,林道发,杨家沅;采用模糊切分实现非特定人连接数字语音识别[J];四川大学学报(自然科学版);1994年02期
4 陈斐利,朱杰;一种新的基于自相关相似距离的语音信号端点检测方法[J];上海交通大学学报;1999年09期
5 韦晓东,胡光锐,任晓林;应用倒谱特征的带噪语音端点检测方法[J];上海交通大学学报;2000年01期
6 韦晓东,胡光锐,任晓林;应用倒谱特征的带噪语音端点检测方法[J];上海交通大学学报;2000年02期
7 茅晓泉,胡光锐;基于最大互信息的离散隐马尔柯夫模型训练方法[J];上海交通大学学报;2001年11期
8 朱杰,韦晓东;噪声环境中基于HMM模型的语音信号端点检测方法[J];上海交通大学学报;1998年10期
9 马明,张杰,王建宇,黄志同;语音识别中隐马尔可夫模型初值的估计[J];数据采集与处理;1997年02期
10 刘承玺;语音识别算法的确定与实现[J];天津通信技术;1995年01期
中国博士学位论文全文数据库 前1条
1 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
中国硕士学位论文全文数据库 前6条
1 毕丽克孜;现代维吾尔语语料库词频统计实验性研究[D];新疆大学;2003年
2 全必胜;非线性信道传输的码元识别方法研究[D];西北工业大学;2003年
3 陆晔;基于隐马尔可夫算法的上海城市路名语音识别方法研究[D];华东师范大学;2002年
4 朱淑琴;语音识别系统关键技术研究[D];西安电子科技大学;2004年
5 常红;现代维吾尔语基本词汇研究[D];新疆大学;2005年
6 包世恩;蒙古语非特定人大词汇量连续语音识别系统的研究与实现[D];内蒙古大学;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026