收藏本站
《西安电子科技大学》 1999年
收藏 | 手机打开
二维码
手机客户端打开本文

实用化汉语语音识别理论及关键技术研究

田斌  
【摘要】: 语音识别技术已经取得令人鼓舞的成就。但是,大多数语音识别系统仍局限 于实验室中应用,远没有达到实用化要求。制约实用化的根本原因可以归为两 类,识别精度和系统复杂度。本文就是从这两方面深入研究汉语语音识别实用化 面临的理论和技术问题,并用大量的实验进行证明。 1.从通信理论的观点分析了汉语语言系统的信源特性,首次从信息论的角度 提出了汉语的根本特点:它拥有非常庞大的基本符号集,每个信源符号所携带的 主观信息量可以非常大,而由于上下文相关性其信源熵却并不高。 2.提出一种矢量压缩编码新方法—矢量线上投影法,它将输入矢量用它在某 条空间直线上的投影近似表示。理论分析和实验结果表明:码书大小为N的线上 投影法的编码精度与码书大小为N~2的矢量量化法相当,并且明显优于用两个大小 为N的码书构成的两级矢量量化法,而其码书生成和编码的计算复杂度远低于后 者。 3.提出了基于训练数据的加性噪声和Lombard及Loud效应的联合补偿法。 对于加性噪声是从谱减法的逆向角度对训练数据在频谱域进行谱加;对于 Lombard和Loud语音,则采用基于隐马尔可夫模型(HMM)状态标注的训练数据 补偿。这种联合补偿使识别系统在强噪声环境下具有很高的鲁棒性,并且不影响 识别系统在正常环境或正常发音时的识别性能,不增加识别时的运算复杂度。 4.提出了基于隐马尔可夫模型的语音识别系统中状态和状态驻留相关的声学 置信量度准则。这些拒识准则不仅能很好地拒识词表外语音(OOV或非关键 词),而且能在较低拒识率的情况下有效地提高系统的识别率。另外,并根据汉 语语音的特殊结构提出了一种基于部分拒识原则的快速搜索算法,既保持了N— Best算法的高识别率,又大大地减小了搜索空间,提高了识别系统的实时性能。 5.提出一种利用同一个句子内最有效预测词对信息的扩展二元文法模型,有 效地描述了汉语词语组合中的长距离位移现象。并且提出了最小复杂度准则的有 效词对发现算法,克服了互信息准则忽略了各种语言预测单元信息覆盖的缺点。 另外,提出一种利用声学匹配提供的汉语分词信息来改进汉语统计语言模型的新 方法。
【学位授予单位】:西安电子科技大学
【学位级别】:博士
【学位授予年份】:1999
【分类号】:TN912.3

【引证文献】
中国期刊全文数据库 前1条
1 田斌,易克初;一种用于强噪声环境下语音识别的含噪Lombard及Loud语音补偿方法[J];声学学报;2003年01期
中国硕士学位论文全文数据库 前6条
1 王光艳;语音信号处理中的数学形态学方法研究[D];河北工业大学;2003年
2 江官星;非特定人孤立词语音识别系统的研究[D];西南交通大学;2006年
3 师晨曦;基于句型库的语音识别研究[D];大连理工大学;2006年
4 史俊;语音数控机床的研究与实现[D];沈阳航空工业学院;2007年
5 周振辉;机器人手术网络遥控系统—语音识别和机械手控制[D];沈阳航空工业学院;2006年
6 赫连浩博;汉语语音预处理及孤立词识别方法研究[D];山东大学;2007年
【参考文献】
中国期刊全文数据库 前10条
1 石贵青,徐秉铮;汉字字频分布、最佳编码与输入问题[J];电子学报;1984年04期
2 高雨青,黄泰翼,陈韶岩;听觉模型用于语音识别以及与一般方法的比较[J];电子学报;1993年10期
3 战普明,王作英,陆大 ;语音识别隐马尔可夫模型的改进[J];电子学报;1994年01期
4 李苇营,易克初,胡征;神经网络与HMM构成的混合网络在语音识别中应用的研究[J];电子学报;1994年10期
5 李苇营,易克初,吴文虎,方棣棠;基于有限状态径向基函数网络的汉语语音识别研究[J];电子学报;1996年01期
6 王仁华,倪晋富;汉语语音识别系统评估[J];自动化学报;1994年04期
7 俞铁城;用图样匹配法在计算机上自动识别语音[J];物理学报;1977年05期
8 于学武;宽带噪声中语音谱恢复的一个算法[J];声学学报;1989年05期
9 林道发,杨家沅,罗万伯,王跟东;认人的限定主题的连续汉语语音识别系统的研究[J];声学学报;1992年06期
10 陈韬,李昌立,莫福源;汉语孤立字全音节实时识别系统[J];声学学报;1993年03期
【共引文献】
中国期刊全文数据库 前10条
1 施俊强,池明敏;基于TMS320C54x DSKplus的实时TCM语音编解码算法的实现[J];半导体技术;2001年08期
2 邓勇,施文康;基于TMS320C50的语音频谱分析仪[J];兵工自动化;2000年03期
3 徐俊晓,谢锋,江建平,莫运明,郑中华;我国12种无尾类的鸣叫特征参数[J];动物学杂志;2005年03期
4 冯成林,吴淑珍;一种噪声环境下的语音识别方法(线性预测误差法)的研究[J];北京大学学报(自然科学版);2000年05期
5 黄新宇,吴淑珍;基于单边自相关线性预测噪声中汉语语音识别[J];北京大学学报(自然科学版);2000年05期
6 刘敬伟,程乾生;基于动态时间规划的基因芯片数据识别[J];北京大学学报(自然科学版);2002年05期
7 段新,黄新宇,吴淑珍;与文本无关的说话人辨认系统中一种新的使用基音周期方法研究[J];北京大学学报(自然科学版);2003年05期
8 王炜,刘峰,吴淑珍;RASTA滤波在语音通信质量客观评价中应用的研究[J];北京大学学报(自然科学版);2003年05期
9 刘惠华,潘建军,周冰,范京;稀疏谱线合成对元音频域信息分布的探讨[J];北京机械工业学院学报;2005年01期
10 何强,毛士艺,张有为;汉语语音识别的平滑声韵基元HMM算法[J];北京航空航天大学学报;2001年02期
中国重要会议论文全文数据库 前10条
1 郭巧;张立伟;陆际联;;汉语语音信号的端点检测与切分[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
2 张连海;王杰锋;王炳锡;;基于语音多带激励模型的基音周期估计算法研究[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
3 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 牟峰;俞铁城;杨道淳;;新型半波语音编解码的实现[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
5 邹绘华;李双田;;基于频谱斜率约束的变速率语音编码算法研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
6 李灿伟;杨震;;基于DCT的有色噪声消除算法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
7 周珺;范京;刘惠华;;汉语语音音量和语速变化的自适应的调整[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
8 孙海;范京;刘惠华;;汉语连续语音中的单字起止点综合判别的新方法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 朱学勇;刘亚康;杨乐;;一种基于MBE模型的2.4Kbps语音编码器算法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
10 张玲华;杨震;郑宝玉;;一种修正的倒谱公式及其在说话人识别中的应用[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
3 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
4 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
5 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
6 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
7 高二中;对话电话语音的话者确认研究[D];中国科学技术大学;2011年
8 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
9 刘靖年;汉字结构研究[D];吉林大学;2011年
10 魏宇;基于小波变换的舰船航行数据记录仪数字水印算法的研究[D];哈尔滨工程大学;2011年
中国硕士学位论文全文数据库 前10条
1 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
2 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
3 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
4 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
5 楼佳;基于网络QoS的AMR语音编码算法研究[D];哈尔滨工程大学;2010年
6 周翠梅;说话人识别技术的研究与实现[D];大连理工大学;2010年
7 袁铄;基于小波网络音频信号处理技术[D];大连理工大学;2010年
8 庞敏辉;语音库自动构建技术的研究[D];中国海洋大学;2010年
9 郭秋雨;小词汇量非特定人的孤立词语音识别系统研究[D];中国海洋大学;2010年
10 单进;基于压缩感知的鲁棒性说话人识别[D];苏州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 冯成林,吴淑珍;一种噪声环境下的语音识别方法(线性预测误差法)的研究[J];北京大学学报(自然科学版);2000年05期
2 吴淑珍,冯成林,黄新宇;噪声环境下语音识别方法研究[J];北京大学学报(自然科学版);2001年03期
3 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
4 诸刚;汉语语音识别技术在机器人控制中的应用[J];北京市计划劳动管理干部学院学报;2004年01期
5 王毓芳,尹宝林;一种自适应的汉语普通话音节清浊音分段方法[J];北京航空航天大学学报;2001年04期
6 秦斌杰,孙九爱;计算机辅助手术向远程手术方向的发展[J];北京生物医学工程;2002年02期
7 王红睿;赵黎明;裴剑;;均衡化的改进K均值聚类法[J];吉林大学学报(信息科学版);2006年02期
8 李祖鹏,姚佩阳;一种语音段起止端点检测新方法[J];电讯技术;2000年03期
9 张军,肖自美,韦岗;MBE语音模型中快速基音细搜索算法的研究[J];电路与系统学报;2001年02期
10 顾良,刘润生;改进汉语数码语音识别中的语音特征提取性能[J];电路与系统学报;1997年04期
中国重要会议论文全文数据库 前1条
1 杨大利;徐明星;吴文虎;;噪音环境下的语音识别研究概述[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
中国博士学位论文全文数据库 前3条
1 付强;语音的参数表示和质量客观评价研究[D];西安电子科技大学;2000年
2 钟金宏;基于音节的汉语连续语音声调识别方法研究[D];合肥工业大学;2001年
3 丁沛;语音识别中的抗噪声技术[D];清华大学;2003年
中国硕士学位论文全文数据库 前10条
1 陈大为;基于HMM的说话人识别改进研究及应用[D];浙江大学;2002年
2 张兰芳;基于Visual C++开发的并联六自由度平台测控系统[D];浙江大学;2002年
3 雷静;语音识别技术的研究及基本实现[D];武汉理工大学;2002年
4 熊飞丽;语音识别技术在语言教学软件中的应用研究[D];国防科学技术大学;2002年
5 刘永红;说话人识别系统的研究[D];西南交通大学;2003年
6 朱淑琴;语音识别系统关键技术研究[D];西安电子科技大学;2004年
7 修国浩;基于WD/HMM的语音识别算法研究[D];燕山大学;2004年
8 张众;小型语音识别系统的研究和开发[D];天津大学;2004年
9 张卫清;语音识别算法的研究[D];南京理工大学;2004年
10 谭东昱;基于小波变换的语音增强方法研究及实时实现[D];湖南大学;2004年
【二级引证文献】
中国期刊全文数据库 前7条
1 夏俊杰;杨青;赵刚;;语音识别组件转化为控件的方法[J];电子设计工程;2012年14期
2 王光艳;赵晓群;王霞;;基于数学形态学的非线性语音增强方法[J];计算机工程与应用;2006年34期
3 于辉;;基于FFT和FIR滤波的语音数据处理研究[J];河南理工大学学报(自然科学版);2012年05期
4 张磊,韩纪庆,王承发;一种对应力变异语音的特征补偿方法[J];声学学报;2004年01期
5 吕成国,韩纪庆,王承发;动态时间规正与差别子空间相结合的变异语音识别方法[J];声学学报;2005年03期
6 姚徐;李永宏;单广荣;于洪志;;藏语孤立词语音识别系统研究[J];西北民族大学学报(自然科学版);2009年01期
7 魏巍;张海涛;;一种基于HTK的数字语音识别系统[J];计算机系统应用;2011年09期
中国重要会议论文全文数据库 前1条
1 郭皓婷;;基于声纹识别技术的应用难点研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
中国博士学位论文全文数据库 前5条
1 郑建炜;基于核方法的说话人辨认模型研究[D];浙江工业大学;2010年
2 陈为国;实时语音信号处理系统理论和应用[D];浙江大学;2004年
3 徐以中;语音听觉反馈对言语发声的影响[D];浙江大学;2007年
4 徐利敏;说话人辨认中的特征变换和鲁棒性技术研究[D];南京理工大学;2008年
5 李燕萍;说话人辨认中的特征参数提取和鲁棒性技术研究[D];南京理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 袁铄;基于小波网络音频信号处理技术[D];大连理工大学;2010年
2 郭秋雨;小词汇量非特定人的孤立词语音识别系统研究[D];中国海洋大学;2010年
3 章颖颖;基于语言混合特征的情感识别研究[D];安徽大学;2011年
4 杨智鑫;移动机器人语音识别系统的研究与实现[D];北京化工大学;2011年
5 郑泽萍;基于保局部核多元RVM的说话人识别方法研究[D];浙江工业大学;2011年
6 王震宇;基于支持向量数据描述的说话人识别研究[D];浙江工业大学;2011年
7 刘雪飞;基于小波分析方法的含噪声语音信号增强技术研究[D];燕山大学;2006年
8 王洁丽;数学形态学在语音信号处理中的应用[D];河北工业大学;2006年
9 罗俊光;基于DSP的嵌入式非特定人孤立词语音识别系统的研究与设计[D];广东工业大学;2007年
10 刘丽娟;噪声环境下语音识别系统研究[D];西北大学;2007年
【二级参考文献】
中国期刊全文数据库 前7条
1 于学武,袁保宗;用伪贝叶斯包络估计方法从噪音中提取语音信号[J];电子学报;1985年03期
2 俞一彪,袁保宗;连续语音识别中句法结构知识的利用[J];电子学报;1990年06期
3 林才松;芦欣;韦诚;;汉字输入输出方案及其模拟[J];华南工学院学报;1982年Z1期
4 林道发,罗万伯,杨家沅;用矢量量化和隐马尔可夫模型实现英语话句的识别[J];四川大学学报(自然科学版);1991年03期
5 齐士钤,张家騄;汉语普通话辅音音长分析[J];声学学报;1982年01期
6 陈韬,李昌立,莫福源;汉语孤立字全音节实时识别系统[J];声学学报;1993年03期
7 张家騄,齐士钤,吕士楠;汉语辅音知觉结构初探[J];心理学报;1981年01期
【相似文献】
中国期刊全文数据库 前10条
1 王锐;李灏;齐海鹏;;语音遥控系统中VQ算法的研究[J];科技信息(学术研究);2007年36期
2 殷建;殷业;徐毅;;基于矢量量化的仿生模式识别方法研究[J];无锡职业技术学院学报;2007年05期
3 魏艳娜;王社国;;一种新的基于遗传算法的VQ码本优化方法[J];现代电子技术;2006年13期
4 王社国;魏艳娜;;基于遗传算法的VQ码本设计及语音识别[J];计算机工程与应用;2007年17期
5 姜天辰,夏仁平;基于VQ/HMM的自学习语音识别系统[J];计算机工程与应用;1998年05期
6 王红睿;赵黎明;裴剑;;均衡化的改进K均值聚类法[J];吉林大学学报(信息科学版);2006年02期
7 于倩;李春利;;自适应矢量量化在语音识别中的应用[J];现代电子技术;2007年06期
8 王可,王翠梅;用模拟退火算法实现语音识别中的矢量量化[J];电子与信息学报;2000年01期
9 卢玮,姜晔,赵力,吴镇扬;语音识别技术在电话语音自动拨号中的应用[J];电声技术;2001年02期
10 马洪连;朱杰;杨凤岐;孟新雨;;基于DSP的声控系统的设计与实现[J];测控技术;2005年12期
中国重要会议论文全文数据库 前10条
1 曹雨;景新幸;杨海燕;;语音识别中一种改进的模糊C-均值(FCM)聚类矢量量化[A];2008年全国声学学术会议论文集[C];2008年
2 计天颖;王作英;陆大金;;有限命令集连续语音识别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
3 余鹏;王作英;;语音识别码本状态间的线性和非线性相关性[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 宋君;葛余博;;应用于鲁棒语音识别的置信度加权特征丢失法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
5 靳慧龙;;基于DSP的电视语音拨号遥控技术[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
6 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
7 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 马晓川;刘冬;赵荣椿;;孤立短语隐马尔可夫模型自动建模软件的实现[A];第四届全国人机语音通讯学术会议论文集[C];1996年
9 郭晨;;汉语语音技术[A];第一届学生计算语言学研讨会论文集[C];2002年
10 赵海滨;王宏;闻绍飞;;嵌入式语音识别控制机械手的系统设计[A];第二届全国信息获取与处理学术会议论文集[C];2004年
中国重要报纸全文数据库 前10条
1 中国科学院声学研究所研究员 俞铁城;解析语音识别的发展现状[N];通信产业报;2004年
2 黄梦;方案商积极切入语音识别市场[N];电脑商报;2006年
3 本报记者 刘学习;认准语音识别的“内核”[N];计算机世界;2002年
4 ;“超人类语音识别”计划[N];中国计算机报;2002年
5 ;Intel涉足语音识别[N];计算机世界;2003年
6 本报记者 艾文;语音识别:IBM继续领跑[N];中国计算机报;2001年
7 小雷;芝麻开门[N];电脑商报;2006年
8 记者 潘治;汽车真能听话[N];新华每日电讯;2002年
9 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年
10 本报记者 钟洪奇;Pattek语音识别产品: 找一条走得通的路[N];计算机世界;2002年
中国博士学位论文全文数据库 前10条
1 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
2 刘继新;基于矢量量化技术的音频信息隐藏算法的研究[D];哈尔滨工业大学;2010年
3 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
4 王冬芳;基于矢量量化技术的图像实时压缩芯片的研究[D];西安理工大学;2009年
5 孙颖;情感语音识别与合成的研究[D];太原理工大学;2011年
6 李伟;基于内容的汉语语音检索技术研究与系统实现[D];清华大学;2011年
7 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
8 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
9 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
10 郑勇;小波图像分类矢量量化与网络编码量化的研究[D];电子科技大学;2002年
中国硕士学位论文全文数据库 前10条
1 张志刚;基于神经网络/HMM的语音识别算法的研究[D];武汉理工大学;2006年
2 魏艳娜;语音识别的矢量量化技术研究[D];河北工程大学;2007年
3 曾昭才;VQ和HMM在语音识别中的应用[D];东南大学;2006年
4 齐海鹏;孤立词汇语音识别IP软核设计技术研究[D];合肥工业大学;2005年
5 陈晓霖;基于隐马尔可夫模型的语音识别方法的研究[D];山东大学;2005年
6 张俊;基于VQ和DTW相结合的语音识别算法研究[D];武汉理工大学;2007年
7 罗飞;语音识别技术在虚拟校园中的应用研究[D];华中师范大学;2007年
8 王霅煜;基于VQ和ASR的多媒体课件检索[D];上海交通大学;2010年
9 刘竹涛;基于矢量量化的语种识别[D];哈尔滨工程大学;2005年
10 郭恒飞;基于非特定人车载电器语音集成控制系统的设计与实现[D];合肥工业大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026