收藏本站
收藏 | 论文排版

实用化汉语语音识别理论及关键技术研究

田斌  
【摘要】: 语音识别技术已经取得令人鼓舞的成就。但是,大多数语音识别系统仍局限 于实验室中应用,远没有达到实用化要求。制约实用化的根本原因可以归为两 类,识别精度和系统复杂度。本文就是从这两方面深入研究汉语语音识别实用化 面临的理论和技术问题,并用大量的实验进行证明。 1.从通信理论的观点分析了汉语语言系统的信源特性,首次从信息论的角度 提出了汉语的根本特点:它拥有非常庞大的基本符号集,每个信源符号所携带的 主观信息量可以非常大,而由于上下文相关性其信源熵却并不高。 2.提出一种矢量压缩编码新方法—矢量线上投影法,它将输入矢量用它在某 条空间直线上的投影近似表示。理论分析和实验结果表明:码书大小为N的线上 投影法的编码精度与码书大小为N~2的矢量量化法相当,并且明显优于用两个大小 为N的码书构成的两级矢量量化法,而其码书生成和编码的计算复杂度远低于后 者。 3.提出了基于训练数据的加性噪声和Lombard及Loud效应的联合补偿法。 对于加性噪声是从谱减法的逆向角度对训练数据在频谱域进行谱加;对于 Lombard和Loud语音,则采用基于隐马尔可夫模型(HMM)状态标注的训练数据 补偿。这种联合补偿使识别系统在强噪声环境下具有很高的鲁棒性,并且不影响 识别系统在正常环境或正常发音时的识别性能,不增加识别时的运算复杂度。 4.提出了基于隐马尔可夫模型的语音识别系统中状态和状态驻留相关的声学 置信量度准则。这些拒识准则不仅能很好地拒识词表外语音(OOV或非关键 词),而且能在较低拒识率的情况下有效地提高系统的识别率。另外,并根据汉 语语音的特殊结构提出了一种基于部分拒识原则的快速搜索算法,既保持了N— Best算法的高识别率,又大大地减小了搜索空间,提高了识别系统的实时性能。 5.提出一种利用同一个句子内最有效预测词对信息的扩展二元文法模型,有 效地描述了汉语词语组合中的长距离位移现象。并且提出了最小复杂度准则的有 效词对发现算法,克服了互信息准则忽略了各种语言预测单元信息覆盖的缺点。 另外,提出一种利用声学匹配提供的汉语分词信息来改进汉语统计语言模型的新 方法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王锐;李灏;齐海鹏;;语音遥控系统中VQ算法的研究[J];科技信息(学术研究);2007年36期
2 殷建;殷业;徐毅;;基于矢量量化的仿生模式识别方法研究[J];无锡职业技术学院学报;2007年05期
3 魏艳娜;王社国;;一种新的基于遗传算法的VQ码本优化方法[J];现代电子技术;2006年13期
4 王社国;魏艳娜;;基于遗传算法的VQ码本设计及语音识别[J];计算机工程与应用;2007年17期
5 姜天辰,夏仁平;基于VQ/HMM的自学习语音识别系统[J];计算机工程与应用;1998年05期
6 王红睿;赵黎明;裴剑;;均衡化的改进K均值聚类法[J];吉林大学学报(信息科学版);2006年02期
7 于倩;李春利;;自适应矢量量化在语音识别中的应用[J];现代电子技术;2007年06期
8 王可,王翠梅;用模拟退火算法实现语音识别中的矢量量化[J];电子与信息学报;2000年01期
9 卢玮,姜晔,赵力,吴镇扬;语音识别技术在电话语音自动拨号中的应用[J];电声技术;2001年02期
10 马洪连;朱杰;杨凤岐;孟新雨;;基于DSP的声控系统的设计与实现[J];测控技术;2005年12期
11 李晶皎,孙杰,姚天顺;SFCM模糊聚类在语音矢量量化中的应用[J];东北大学学报(自然科学版);1998年06期
12 张杰;告别键盘、鼠标 与计算机人性化交流[J];中国计算机用户;2004年39期
13 林道发,罗万伯,杨家沅;用矢量量化和隐马尔可夫模型实现英语话句的识别[J];四川大学学报(自然科学版);1991年03期
14 刘雅琴,杜海明;基于矢量量化的说话人识别[J];洛阳师范学院学报;2005年05期
15 檀蕊莲;;基于VQ的说话人识别技术研究[J];信息技术;2010年08期
16 蔡艺,张军,韦岗;改进的MKM算法及其在语音识别中的应用[J];计算机工程与应用;2005年25期
17 胡钢,沈文轩;一种基于噪声动态检测的语音端点检测算法[J];鞍山科技大学学报;2004年02期
18 宋敏;刘幺和;谭保华;;MATLAB环境下基于矢量量化的说话人识别系统[J];湖北工业大学学报;2006年06期
19 马静;李国勇;王珺;;基于改进VQ算法的说话人识别[J];机械工程与自动化;2008年04期
20 李海洲,徐秉铮;语音的音素状态模型[J];华南理工大学学报(自然科学版);1992年04期
中国重要会议论文全文数据库 前10条
1 曹雨;景新幸;杨海燕;;语音识别中一种改进的模糊C-均值(FCM)聚类矢量量化[A];2008年全国声学学术会议论文集[C];2008年
2 计天颖;王作英;陆大金;;有限命令集连续语音识别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
3 余鹏;王作英;;语音识别码本状态间的线性和非线性相关性[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 宋君;葛余博;;应用于鲁棒语音识别的置信度加权特征丢失法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
5 靳慧龙;;基于DSP的电视语音拨号遥控技术[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
6 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
7 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 马晓川;刘冬;赵荣椿;;孤立短语隐马尔可夫模型自动建模软件的实现[A];第四届全国人机语音通讯学术会议论文集[C];1996年
9 郭晨;;汉语语音技术[A];第一届学生计算语言学研讨会论文集[C];2002年
10 赵海滨;王宏;闻绍飞;;嵌入式语音识别控制机械手的系统设计[A];第二届全国信息获取与处理学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
2 刘继新;基于矢量量化技术的音频信息隐藏算法的研究[D];哈尔滨工业大学;2010年
3 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
4 王冬芳;基于矢量量化技术的图像实时压缩芯片的研究[D];西安理工大学;2009年
5 孙颖;情感语音识别与合成的研究[D];太原理工大学;2011年
6 李伟;基于内容的汉语语音检索技术研究与系统实现[D];清华大学;2011年
7 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
8 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
9 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
10 郑勇;小波图像分类矢量量化与网络编码量化的研究[D];电子科技大学;2002年
中国硕士学位论文全文数据库 前10条
1 张志刚;基于神经网络/HMM的语音识别算法的研究[D];武汉理工大学;2006年
2 魏艳娜;语音识别的矢量量化技术研究[D];河北工程大学;2007年
3 曾昭才;VQ和HMM在语音识别中的应用[D];东南大学;2006年
4 齐海鹏;孤立词汇语音识别IP软核设计技术研究[D];合肥工业大学;2005年
5 陈晓霖;基于隐马尔可夫模型的语音识别方法的研究[D];山东大学;2005年
6 张俊;基于VQ和DTW相结合的语音识别算法研究[D];武汉理工大学;2007年
7 罗飞;语音识别技术在虚拟校园中的应用研究[D];华中师范大学;2007年
8 王霅煜;基于VQ和ASR的多媒体课件检索[D];上海交通大学;2010年
9 刘竹涛;基于矢量量化的语种识别[D];哈尔滨工程大学;2005年
10 郭恒飞;基于非特定人车载电器语音集成控制系统的设计与实现[D];合肥工业大学;2011年
中国重要报纸全文数据库 前10条
1 中国科学院声学研究所研究员 俞铁城;解析语音识别的发展现状[N];通信产业报;2004年
2 黄梦;方案商积极切入语音识别市场[N];电脑商报;2006年
3 本报记者 刘学习;认准语音识别的“内核”[N];计算机世界;2002年
4 ;“超人类语音识别”计划[N];中国计算机报;2002年
5 ;Intel涉足语音识别[N];计算机世界;2003年
6 本报记者 艾文;语音识别:IBM继续领跑[N];中国计算机报;2001年
7 小雷;芝麻开门[N];电脑商报;2006年
8 记者 潘治;汽车真能听话[N];新华每日电讯;2002年
9 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年
10 本报记者 钟洪奇;Pattek语音识别产品: 找一条走得通的路[N];计算机世界;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978