收藏本站
《哈尔滨工程大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于HMM和ANN的汉语语音识别

陈立伟  
【摘要】:语音识别是一门内涵丰富、应用广泛的技术,它的实用性和趣味性使得人们对它有着迫切的应用需求。语音识别正在办公或商业系统的数据库语音查询、工业生产部门的语声控制、电话与电信系统的自动拨号以及医疗和卫生等领域发挥重要的作用,并且极有可能成为下一代操作系统和应用程序的用户界面。 虽然语音识别已经取得巨大的成就,形成了隐马尔可夫模型、矢量量化、动态时间规正等有效技术,出现了一些比较成功的语音识别系统,但是面临实用化时还是存在一些问题。例如:语音识别系统的适应性差,对环境依赖性强,在某种环境下建立的语音识别系统只能在这种环境下应用,否则系统性能将急剧下降,而且全世界共有上千种语言,每种语言又有许多种方言,随着环境的改变,识别系统的性能也必然会下降。本文着眼于汉语语音识别系统实用中所面临的主要问题,以提高识别率和提高识别系统的抗噪声能力为目的,研究汉语语音识别实用化理论和关键技术。本文用大量的实验和数据来证实了所提出方法的有效性。主要研究工作和取得的成果如下: 1.介绍语音识别系统中涉及到的基本概念及原理,分析一般语音识别系统的结构及所用到的各种理论技术,包括语音识别单元的选取、特征参数提取、模式匹配及模型训练等技术。另外,对语音识别系统的发展史、研究现状、分类方式以及目前所面临的问题等也进行了阐述。 2.系统地研究了语音识别各种主要特征参数的提取方法,特别分析和研究了反映语音倒谱特征的线性预测倒谱系数(LPCC)和美尔频率倒谱系数(MFCC)的提取方法。并且为了反映特征参数的动态特性,本文还提出采用LPCC、MFCC一阶、二阶差分参数来进行语音识别的方法;本文还研究了线谱频率参数(LSF)及其快速求解算法,快速算法所需存储空间更小、各种代数运算次数更少、软件实现更简单。 3.针对噪声环境下的语音识别,本文提出了一种将连续概率密度隐马尔可夫模型(CDHMM)与自组织特征映射神经网络(SOFM)相结合而构成
【学位授予单位】:哈尔滨工程大学
【学位级别】:博士
【学位授予年份】:2005
【分类号】:TN912.3

【引证文献】
中国博士学位论文全文数据库 前2条
1 何新;基于内容的音频信息分类检索技术研究[D];南京理工大学;2007年
2 孟庆梅;仿人头像机器人人工情感建模与实现的研究[D];哈尔滨工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 刘志伟;基于ARM的语音识别研究[D];东华大学;2011年
2 周晓一;基于遗传算法的计算机辅助语音处理研究[D];山东师范大学;2011年
3 唐娜娜;基于稳健性PLPC的抗噪语音识别方法的研究[D];辽宁大学;2011年
4 李硕;孤立词语音识别算法的研究和实现[D];哈尔滨工业大学;2010年
5 严欢;汉语连续语音声调及数字串识别系统的研究[D];哈尔滨理工大学;2011年
6 黄秋晨;车载汉语语音控制命令识别算法的研究[D];东北师范大学;2011年
7 林剑峰;自主心智发育机器人的语音感知映射[D];复旦大学;2008年
8 邓杏娟;基于语音识别技术的失语症辅助诊断及康复治疗系统的研究[D];重庆大学;2008年
9 谢春荣;声纹识别技术在司法鉴定中的应用研究[D];厦门大学;2008年
10 马伟荣;基于HMM模型的连接词语音识别的抗噪研究[D];西北大学;2009年
【参考文献】
中国期刊全文数据库 前7条
1 戴红霞,赵力;采用帧概率变换的与文本无关说话人识别系统的实现[J];电声技术;2004年09期
2 王作英,肖熙;基于段长分布的HMM语音识别模型[J];电子学报;2004年01期
3 李映,白本督,焦李成;一种基于模糊神经网络的非线性系统模型辨识方法[J];电子与信息学报;2002年03期
4 邵央,刘丙哲,李宗葛;基于MFCC和加权矢量量化的说话人识别系统[J];计算机工程与应用;2002年05期
5 黄玲,潘孟贤;基于VQ/CDHMM的噪声环境下汉语口令识别研究[J];计算机工程与应用;2003年28期
6 刘敬伟;徐美芝;郑忠国;程乾生;;基于DTW的语音识别和说话人识别的特征选择[J];模式识别与人工智能;2005年01期
7 吴尊敬,曹志刚;用于抗噪声说话人识别的直接倒谱加权GMM模型[J];数据采集与处理;2005年01期
【共引文献】
中国期刊全文数据库 前10条
1 徐港;卫军;王青;;基于WEB的结构仿真试验[J];四川建筑科学研究;2006年01期
2 冯清海;袁万城;樊启武;;基于FE—ANN—MC的结构可靠度计算方法研究[J];四川建筑科学研究;2008年04期
3 李峻;孙世群;;基于BP网络模型的青弋江水质预测研究[J];安徽工程科技学院学报(自然科学版);2008年02期
4 相征;朗朗;王静;;基于基音频能值的端点检测算法[J];安徽工程科技学院学报(自然科学版);2008年03期
5 张艳;张海军;;基于DSP的多通道超声波连续测厚系统的研究[J];安徽工程科技学院学报(自然科学版);2008年03期
6 王世东;陈杨;张本福;孙光灵;黄晓梅;;八叉树在三维建模中的应用[J];安徽建筑工业学院学报(自然科学版);2006年06期
7 王世东;;Voronoi在GCS建模中的应用[J];安徽建筑工业学院学报(自然科学版);2007年05期
8 祝翠;钱家忠;周小平;马雷;;BP神经网络在潘三煤矿突水水源判别中的应用[J];安徽建筑工业学院学报(自然科学版);2010年05期
9 李峻;孙世群;;BP神经网络在青弋江水质评价上的应用[J];安徽建筑;2008年03期
10 张聪;;储粮害虫声信号编解码系统的设计与实现[J];安徽农业科学;2006年21期
中国重要会议论文全文数据库 前10条
1 王国庆;李国福;李旭渊;;基于PSO-K均值聚类的核事故应急监测点位快速确定技术研究[A];全国危险物质与安全应急技术研讨会论文集(上)[C];2011年
2 边红昌;程德福;祁玉林;张坤;;基于DSP和ZigBee无线智能语音控制系统设计[A];第二十六届中国控制会议论文集[C];2007年
3 董静;刘健刚;;英语寂语声信号检测[A];2011'中国西部声学学术交流会论文集[C];2011年
4 杜健;费保俊;刘颖;潘高田;姚国政;;基于神经网络的导航装备维修能力评估研究[A];第二届中国卫星导航学术年会电子文集[C];2011年
5 姜静;孟利东;孙铁;姜琳;;电弧炉三相电极神经网络控制器的研究[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
6 田业;贾珈;江建博;蔡莲红;;汉语普通话声调增强算法的研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 李曼曼;杨鸿武;洪宁;杨硕;刘亚丽;;基于EMD的带噪语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 刘博;杨鸿武;甘振业;李曼曼;孙红英;;面向藏语机读音标SAMPA-T的字音转换[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
9 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
10 张瑞华;陈国华;颜伟文;陈清光;;基于VC与MATLAB接口技术的LPG储罐重大事故动态模拟评价系统软件开发与应用[A];第十四届海峡两岸及香港、澳门地区职业安全健康学术研讨会暨中国职业安全健康协会2006年学术年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 陈宇;电容层析成像反问题求解及图像重建算法研究[D];哈尔滨理工大学;2010年
3 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
4 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
5 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
6 孟祥令;弹性织物着装接触压力研究与触压舒适性评价系统的建立[D];东华大学;2010年
7 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
8 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
9 吕琳;天然气水合物(地球物理属性)的神经网络识别方法及软件开发[D];吉林大学;2011年
10 赵鹏;离心泵振动故障诊断方法研究及系统实现[D];华北电力大学(北京);2011年
中国硕士学位论文全文数据库 前10条
1 李锦;基于声波的运动车辆行驶状态辨识理论研究[D];南昌航空大学;2010年
2 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
3 王萍;语音情感识别研究[D];山东科技大学;2010年
4 滕景忠;智能瓦斯传感器的研制[D];山东科技大学;2010年
5 陈斌;PJR-2X型喷浆机器人交互式虚拟样机系统开发[D];山东科技大学;2010年
6 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
7 范不井;某地区电网短期负荷预测研究[D];郑州大学;2010年
8 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
9 朱民杰;基于神经网络的心电图身份识别研究[D];郑州大学;2010年
10 雷明杰;神经网络和遗传算法在中厚板轧机中的应用研究[D];郑州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 郭一博;生物特征识别技术最新动向[J];中国安防产品信息;2004年04期
2 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
3 孙光民,董笑盈;基于神经网络的汉语孤立词语音识别[J];北京工业大学学报;2002年03期
4 李如玮;鲍长春;;一种基于分带谱熵和谱能量的语音端点检测算法[J];北京工业大学学报;2007年09期
5 孟光磊;龚光红;;证据源权重的计算及其在证据融合中的应用[J];北京航空航天大学学报;2010年11期
6 周长锋;韩力群;;概率神经网络在文本无关说话人识别中的应用[J];北京工商大学学报(自然科学版);2007年01期
7 金学骥,叶秀清,顾伟康;预加重与MMSE结合的语音增强方法[J];传感技术学报;2005年02期
8 范影乐;武传艳;李轶;庞全;;基于C_0复杂度的语音端点检测技术研究[J];传感技术学报;2006年03期
9 阙大顺;李星星;胡慧玲;;基于分形维的连续语音实时分割技术[J];电讯技术;2008年11期
10 王铁,张国忠,周淑文;基于竞争神经网络的ABS路面辨识[J];东北大学学报;2003年06期
中国重要会议论文全文数据库 前3条
1 李净;徐明星;张继勇;郑方;吴文虎;方棣棠;;汉语连续语音识别中声学模型基元比较:音节、音素、声韵母[A];第六届全国人机语音通讯学术会议论文集[C];2001年
2 董滨;赵庆卫;颜永红;;发音质量自动评估的现有算法分析[A];第八届全国人机语音通讯学术会议论文集[C];2005年
3 冯晓亮;于水源;;语音识别中三种基于DTW的模板训练方法的比较[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 钟金宏;基于音节的汉语连续语音声调识别方法研究[D];合肥工业大学;2001年
2 王辰;多媒体融合分析技术的研究与实现[D];中国人民解放军国防科学技术大学;2002年
3 丁沛;语音识别中的抗噪声技术[D];清华大学;2003年
4 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
5 唐发明;基于统计学习理论的支持向量机算法研究[D];华中科技大学;2005年
6 陆哲明;矢量量化编码算法及应用研究[D];哈尔滨工业大学;2001年
7 林奕琳;基于语音信号的情感识别研究[D];华南理工大学;2006年
8 李忠伟;支持向量机学习算法研究[D];哈尔滨工程大学;2006年
9 郑贵滨;基于内容的音频信息检索技术研究[D];哈尔滨工业大学;2006年
10 谢波;普通话语音情感识别关键技术研究[D];浙江大学;2006年
中国硕士学位论文全文数据库 前10条
1 康燕;基于HMM的情感语音识别[D];太原理工大学;2011年
2 李青;基于语音信号的情绪识别研究[D];哈尔滨工业大学;2011年
3 杨智鑫;移动机器人语音识别系统的研究与实现[D];北京化工大学;2011年
4 张晓枫;基于小波变换与GMM的说话人识别研究[D];西安电子科技大学;2002年
5 高峰;遗传算法的若干理论分析[D];浙江大学;2003年
6 程捷;辅助视频内容分析的音频技术研究与实现[D];中国人民解放军国防科学技术大学;2003年
7 刘翔;多媒体信息综合检索的关键技术研究[D];浙江大学;2004年
8 朱淑琴;语音识别系统关键技术研究[D];西安电子科技大学;2004年
9 庞雄昌;语音识别及其定点DSP实现[D];西安电子科技大学;2004年
10 刘刚;说话人识别系统设计研究[D];华东师范大学;2004年
【二级引证文献】
中国期刊全文数据库 前5条
1 彭靓;;基于HMM和神经网络的语音识别[J];计算机光盘软件与应用;2012年24期
2 王娜;;汉语语音评分系统的设计与实现[J];绵阳师范学院学报;2012年05期
3 胡扬;年晓红;;一种汉语方言编码与转换机制的研究[J];计算机应用研究;2013年01期
4 王池社;张燕;;基于内容的音频数据库的构建与应用[J];微计算机信息;2010年33期
5 赵慧勤;孙波;;虚拟教师情感合成模型的研究[J];中国电化教育;2012年01期
中国博士学位论文全文数据库 前1条
1 王义萍;基于基底神经节的机器人行为选择与行为序列学习方法[D];南京理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 姚建霄;基于STRAIGHT谱的语音识别算法研究[D];五邑大学;2010年
2 朱星垠;基于自主发育思想的程序设计算法识别研究[D];东华大学;2011年
3 姬鹏宇;色情视频的音频辅助识别[D];北京邮电大学;2011年
4 谢军;虚拟赛场观众情感模型研究[D];南京理工大学;2011年
5 唐娜娜;基于稳健性PLPC的抗噪语音识别方法的研究[D];辽宁大学;2011年
6 侯媛媛;基于摩尔斯码的声韵母汉语语音识别皮肤听声器的研究[D];陕西科技大学;2012年
7 徐利军;基于HMM和神经网络的语音识别研究[D];湖北工业大学;2012年
8 朱志婷;基于SVM的音频分类理论研究及应用[D];华南理工大学;2012年
9 张莎;灰色关联分析新算法研究及其意义[D];东北师范大学;2012年
10 张戈;基于FPGA实时语音识别系统的实现[D];哈尔滨理工大学;2012年
【二级参考文献】
中国期刊全文数据库 前2条
1 张焱,张杰,黄志同;语音识别中隐马尔可夫模型状态数的研究[J];南京理工大学学报;1998年03期
2 齐士钤,张家騄;汉语普通话辅音音长分析[J];声学学报;1982年01期
【相似文献】
中国期刊全文数据库 前10条
1 程庆祥;;语音识别电路简介[J];家电科技;1990年02期
2 张连海,韩华,王炳锡;过零周期转移概率矩阵语音识别方法的改进[J];信息工程学院学报;1994年01期
3 闫守华;语音控制系统的研制[J];成都气象学院学报;1997年03期
4 李晓霞,王东木,李雪耀;语音识别技术评述[J];计算机应用研究;1999年10期
5 李虎生,刘加,刘润生;利用多层感知机映射提高不匹配环境下的语音识别性能[J];电路与系统学报;1999年04期
6 陈海英,于金辉;利用语音识别进行信息检索[J];情报学报;2003年01期
7 刘占军;;我的Word更“听话”[J];电脑知识与技术(经验技巧);2010年10期
8 赵显富;;译者的话[J];计算技术与自动化;1985年04期
9 张忠平;文成义;;基于BP神经网络的汉语语音识别的研究[J];电声技术;1992年09期
10 战普明,王作英,陆大 ;语音识别隐马尔可夫模型的改进[J];电子学报;1994年01期
中国重要会议论文全文数据库 前10条
1 计天颖;王作英;陆大金;;有限命令集连续语音识别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
2 余鹏;王作英;;语音识别码本状态间的线性和非线性相关性[A];第六届全国人机语音通讯学术会议论文集[C];2001年
3 宋君;葛余博;;应用于鲁棒语音识别的置信度加权特征丢失法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 靳慧龙;;基于DSP的电视语音拨号遥控技术[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
5 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
6 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 马晓川;刘冬;赵荣椿;;孤立短语隐马尔可夫模型自动建模软件的实现[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 郭晨;;汉语语音技术[A];第一届学生计算语言学研讨会论文集[C];2002年
9 赵海滨;王宏;闻绍飞;;嵌入式语音识别控制机械手的系统设计[A];第二届全国信息获取与处理学术会议论文集[C];2004年
10 刘秉权;张凯;王晓龙;;语音识别中基于规则的语言模型的研究[A];第五届全国人机语音通讯学术会议论文集[C];1998年
中国重要报纸全文数据库 前10条
1 中国科学院声学研究所研究员 俞铁城;解析语音识别的发展现状[N];通信产业报;2004年
2 黄梦;方案商积极切入语音识别市场[N];电脑商报;2006年
3 本报记者 刘学习;认准语音识别的“内核”[N];计算机世界;2002年
4 ;“超人类语音识别”计划[N];中国计算机报;2002年
5 ;Intel涉足语音识别[N];计算机世界;2003年
6 本报记者 艾文;语音识别:IBM继续领跑[N];中国计算机报;2001年
7 小雷;芝麻开门[N];电脑商报;2006年
8 记者 潘治;汽车真能听话[N];新华每日电讯;2002年
9 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年
10 本报记者 钟洪奇;Pattek语音识别产品: 找一条走得通的路[N];计算机世界;2002年
中国博士学位论文全文数据库 前10条
1 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
2 孙颖;情感语音识别与合成的研究[D];太原理工大学;2011年
3 李伟;基于内容的汉语语音检索技术研究与系统实现[D];清华大学;2011年
4 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
5 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
6 丁沛;语音识别中的抗噪声技术[D];清华大学;2003年
7 宁爱平;人工蜂群算法及其在语音识别中的应用研究[D];太原理工大学;2013年
8 刘庆升;计算机辅助普通话发音评测关键技术研究[D];中国科学技术大学;2010年
9 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
10 陈伟;语音识别声学建模中的主动学习研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 王霅煜;基于VQ和ASR的多媒体课件检索[D];上海交通大学;2010年
2 郭恒飞;基于非特定人车载电器语音集成控制系统的设计与实现[D];合肥工业大学;2011年
3 王秋杰;TD-SCDMA网络测试软件中语音识别模块的设计与实现[D];北京邮电大学;2011年
4 彭峰;基于SALT的交互式语音应答系统——SALT技术的分析与应用[D];四川大学;2004年
5 江超;视频语义提取分析研究[D];西安电子科技大学;2011年
6 朱晗鸣;嵌入式小词汇量语音识别系统的设计与实现[D];大连理工大学;2005年
7 龙丽霞;基于实例语境的语音识别后文本检错与纠错研究[D];北京邮电大学;2010年
8 宋叔飚;神经网络在语音识别中的应用研究[D];西北工业大学;2002年
9 庞雄昌;语音识别及其定点DSP实现[D];西安电子科技大学;2004年
10 熊飞丽;语音识别技术在语言教学软件中的应用研究[D];国防科学技术大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026