收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

实用化汉语语音识别理论及关键技术研究

田斌  
【摘要】: 语音识别技术已经取得令人鼓舞的成就。但是,大多数语音识别系统仍局限 于实验室中应用,远没有达到实用化要求。制约实用化的根本原因可以归为两 类,识别精度和系统复杂度。本文就是从这两方面深入研究汉语语音识别实用化 面临的理论和技术问题,并用大量的实验进行证明。 1.从通信理论的观点分析了汉语语言系统的信源特性,首次从信息论的角度 提出了汉语的根本特点:它拥有非常庞大的基本符号集,每个信源符号所携带的 主观信息量可以非常大,而由于上下文相关性其信源熵却并不高。 2.提出一种矢量压缩编码新方法—矢量线上投影法,它将输入矢量用它在某 条空间直线上的投影近似表示。理论分析和实验结果表明:码书大小为N的线上 投影法的编码精度与码书大小为N~2的矢量量化法相当,并且明显优于用两个大小 为N的码书构成的两级矢量量化法,而其码书生成和编码的计算复杂度远低于后 者。 3.提出了基于训练数据的加性噪声和Lombard及Loud效应的联合补偿法。 对于加性噪声是从谱减法的逆向角度对训练数据在频谱域进行谱加;对于 Lombard和Loud语音,则采用基于隐马尔可夫模型(HMM)状态标注的训练数据 补偿。这种联合补偿使识别系统在强噪声环境下具有很高的鲁棒性,并且不影响 识别系统在正常环境或正常发音时的识别性能,不增加识别时的运算复杂度。 4.提出了基于隐马尔可夫模型的语音识别系统中状态和状态驻留相关的声学 置信量度准则。这些拒识准则不仅能很好地拒识词表外语音(OOV或非关键 词),而且能在较低拒识率的情况下有效地提高系统的识别率。另外,并根据汉 语语音的特殊结构提出了一种基于部分拒识原则的快速搜索算法,既保持了N— Best算法的高识别率,又大大地减小了搜索空间,提高了识别系统的实时性能。 5.提出一种利用同一个句子内最有效预测词对信息的扩展二元文法模型,有 效地描述了汉语词语组合中的长距离位移现象。并且提出了最小复杂度准则的有 效词对发现算法,克服了互信息准则忽略了各种语言预测单元信息覆盖的缺点。 另外,提出一种利用声学匹配提供的汉语分词信息来改进汉语统计语言模型的新 方法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 方棣棠;;汉语语音识别的现状与展望[J];中文信息;1996年02期
2 商周;百家争“鸣”——1998汉语语音识别技术回顾[J];中国计算机用户;1999年07期
3 张宜;汉语语音识别技术的研究与发展[J];广西广播电视大学学报;2003年04期
4 ;中国中文信息学会基础理论专业委员会全国第三届汉字及汉语语音识别学术会议记要[J];中文信息学报;1989年04期
5 一清;;语音识别:以应用为王[J];互联网周刊;1999年23期
6 黄顺珍;;汉语语音识别研究与实践[J];深圳大学学报(理工版);1987年Z2期
7 黄浩;朱杰;;汉语语音识别中区分性声调模型及最优集成方法(英文)[J];Journal of Southeast University;2007年02期
8 赵力;邹采荣;吴镇扬;;基于MQDF的汉语塞音语音识别方法的研究[J];模式识别与人工智能;2000年03期
9 林建臻,孙甲松,王作英;汉语语音识别的抗噪性前端算法及性能分析[J];电声技术;2004年03期
10 黄浩;哈力旦;;汉语语音识别中基频特征的直接声学建模方法[J];计算机工程与应用;2009年30期
11 ;语音识别技术[J];锚杆支护;2001年03期
12 柴佩琪;汉语语音识别中的LPC格型法提取声调[J];计算机应用与软件;1984年02期
13 一清;;谁“语”争锋?——看国内汉语语音识别市场[J];每周电脑报;1998年50期
14 钟晓,周昌乐,俞瑞钊;一种面向汉语语音识别的口形形状识别方法[J];软件学报;1999年02期
15 吴应良,韦岗,李海洲;基于字统计语言模型的汉语语音识别研究[J];计算机应用研究;2000年05期
16 黄寅飞,吴文虎;汉语语音识别技术综述[J];中国计算机用户;2000年11期
17 张涛,郜彦华;汉语数码语音识别中一种新的抗噪声特征参数[J];河南科技大学学报(自然科学版);2005年03期
18 黄浩;朱杰;哈力旦;;汉语语音识别中的区分性声调建模方法[J];计算机工程与应用;2009年11期
19 苏广川;强噪声环境下汉语语音识别的模糊分类算法[J];北京理工大学学报;1997年06期
20 ;全能输入找录易[J];每周电脑报;1999年48期
中国重要会议论文全文数据库 前10条
1 杨丹宇;胡起秀;葛余博;;对分段时变的隐式马尔可夫模型应用于汉语语音识别的研究[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
2 方棣棠;李树青;;汉语语音识别的技术研究与产品开发[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
3 任晓林;何昕;孙放;张亚昕;;Voper:一个嵌入式汉语语音识别系统[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 王霞;董远;JuhaIso-Sipil;;高维倒谱参数在抗噪声汉语语音识别中的应用[A];第六届全国人机语音通讯学术会议论文集[C];2001年
5 刘增寿;朱东升;;一个实时汉语语音识别新算法SSVQ/DTW[A];第二届全国人机语音通讯学术会议论文集[C];1992年
6 杨丹宇;;应用于非特定人孤立词小字表汉语语音识别中的新的隐式概率模型[A];第二届全国人机语音通讯学术会议论文集[C];1992年
7 肖熙;王作英;;神经网预测器在汉语语音识别中的应用[A];第二届全国人机语音通讯学术会议论文集[C];1992年
8 谢春光;葛余博;杜神甫;娄军;;非特定人汉语语音识别中的几个非时齐隐Markov模型[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
9 温建平;王作英;;利用辅音信息提高汉语语音识别率的两种方法[A];第二届全国人机语音通讯学术会议论文集[C];1992年
10 王晓星;;汉语语音模糊模式识别[A];模糊数学和系统成果会论文集[C];1991年
中国博士学位论文全文数据库 前1条
1 黄浩;基于区分性原理的汉语语音识别中声调问题的研究[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 王鹏;调型信息在汉语语音识别中的应用研究[D];中国科学技术大学;2010年
2 辜少鹏;汉语语言的物理特征提取及分析工具的研究与实现[D];东华大学;2011年
3 周珺;在汉语语音识别中语速、音量和音调调整的研究[D];西安电子科技大学;2002年
4 侯媛媛;基于摩尔斯码的声韵母汉语语音识别皮肤听声器的研究[D];陕西科技大学;2012年
5 贾紫娟;汉语语音识别技术研究与实现[D];天津理工大学;2013年
6 王忠文;基于ARM-Linux的抗噪声语音识别技术研究[D];广东工业大学;2008年
7 唐平;基于特定人的汉语语音识别的研究与实现[D];西安电子科技大学;2009年
8 金玮;汉语语音识别中语言模型的并行优化[D];清华大学;2010年
9 王艳;噪声环境下汉语连续语音识别技术研究[D];西北大学;2010年
10 姜干新;基于HMM的分布式语音识别系统的研究与应用[D];浙江大学;2010年
中国重要报纸全文数据库 前10条
1 郭雅圆;自主研发技术谁也不能替代[N];中国乡镇企业报;2005年
2 俞东升;大恒笔2000技巧几则[N];计算机世界;2000年
3 记者 杨晓平;研发中心热战中国[N];中华工商时报;2001年
4 牛建国;WTO下的跨国公司发展态势[N];中国企业报;2002年
5 何渝;计算机教育应体现民族文化[N];光明日报;2003年
6 中国工程院院士、中科院计算技术研究所所长、曙光信息产业有限公司董事长 李国杰;关于发展我国计算机高技术产业的思索[N];科技日报;2000年
7 记者 姚传富;智能语音产业呼之欲出[N];人民邮电;2002年
8 一泓 晓月 海宁;产品新干线[N];金融时报;2000年
9 记者 爱民;语音合成技术我国达到国际领先水平[N];中国电子报;2001年
10 本报记者 张 洪;让机器成为人[N];大众科技报;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978