收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于切分的汉语连续语音识别技术研究

张宝奇  
【摘要】:连续语音识别作为人机交互的关键技术之一,已取得长足进步。如何将声学、语音学和语言学知识融入到基于统计的连续语音识别系统中,进一步提高其性能,是当前连续语音识别研究的热点。由于端点检测不够精确,连续语音识别中会出现较多的删除错误和插入错误,本文针对此问题,研究了语音的切分技术和搜索算法,实现了一个基于切分知识的汉语连续语音识别系统。主要成果如下: 研究了连续语流中男声共振峰的特点,对10名男性8个元音的前4个共振峰进行统计分析,结果显示男性的第二共振峰F2和第三共振峰F3,以及其比值F3/F2更适合作男声单元音的细节辨识。 构建了基于隐马尔可夫模型的连续语音识别基线系统,在此基础上,研究了共振峰、LPC、LPCC、MFCC、PLP等特征参数的连续语音识别性能。实验结果表明,考虑人耳听觉特性的倒谱特征更适用于连续语音识别。对识别错误进一步分析发现,切分不准确是造成系统性能下降的主要原因之一。 提出了一种基于听觉事件检测的汉语语音声韵母切分方法。首先使用耳蜗滤波器组对语音进行滤波,然后在每个频带上检测对应于能量突变的听觉事件,并分别在不同频率范围对听觉事件进行融合以确定候选边界,最后按照二叉树判决,顺序检测清辅音声母、浊辅音声母、零声母音节和普通韵母。实验结果表明,对8KHz采样的干净语音切分准确率可达到88.9%;对信噪比10dB的语音切分准确率可达到82.9%以上。 提出了一种声学层和语言层独立解码的连续语音识别搜索策略。该策略针对切分语段特点,首先在声学层分别构建单音节词法网络和双音节词法网络,进行声学层解码;然后分别采用A*和令牌传递搜索算法进行语言层解码。实验结果表明,声学层采用双音节句法网络,语言层采用令牌传递搜索算法,系统的插入错误和删除错误大幅降低,准确率有较大提高。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 俞一彪,袁保宗;连续语音识别中句法结构知识的利用[J];电子学报;1990年06期
2 谢锦辉,潘小兵;连续语音识别系统性能评估软件[J];计算机应用与软件;1994年02期
3 吴及,刘丰,王作英;连续语音识别系统中测度计算的快速算法研究[J];清华大学学报(自然科学版);1999年05期
4 茅力群;;利用HMM提取连续语音中的口型信息[J];微计算机信息;2006年02期
5 王鸿儒;杨根科;杨祖华;;基于HTK的连续语音识别网站系统的研究和实现[J];微型电脑应用;2010年07期
6 李易军,徐近霈,吴枫;用于连续语音识别的RBF-Gamma-HMM组合模型[J];电子学报;1999年09期
7 付跃文,杜利民;语音识别错误的分类分析[J];计算机应用;2005年02期
8 ;听觉不错 Voice Xpress简化了Word控制,增加了连续语音识别[J];每周电脑报;1998年19期
9 叶虹;;基于仿生模式识别的非特定人连续语音识别的研究[J];浙江工业大学学报;2006年04期
10 ;让中国的计算机“听话”——中文语音识别产品步入实用化阶段[J];互联网周刊;1999年27期
11 王守觉,潘晓霞,徐春燕,陈旭,安冬,曹文明;一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究[J];电子学报;2005年10期
12 孙阿利;蒋冬梅;吕国云;Hichem Sahli;Werner Verhelst;;基于动态贝叶斯网络的语音识别及音素切分研究[J];计算机应用研究;2007年10期
13 张建军;人机对话走向大众[J];中国计算机用户;1998年01期
14 欧智坚,王作英;从线性预测HMM到一种新的语音识别的混合模型[J];电子学报;2002年09期
15 吕萍,吴及,王作英,陆大;连续语音识别中的说话人快速自适应技术[J];清华大学学报(自然科学版);2002年07期
16 陈国平,杜利民,付跃文,王劲林;基于MBIC的决策树聚类算法在连续语音识别中的应用[J];计算机应用;2005年12期
17 秦磊;黄昶;;连续语音关键字识别的方法[J];中国科技信息;2006年20期
18 杨善茜;黄汉明;蒋正锋;李锐;;基于HTK的语音识别网络优化算法[J];计算机工程;2010年14期
19 叶虹;王海伦;姜春娣;;非特定人问候语连续语音识别技术的研究[J];浙江工业大学学报;2010年05期
20 赵鹤鸣,周旭东;基于知识的汉语连续语音识别研究[J];计算机研究与发展;1993年06期
中国重要会议论文全文数据库 前10条
1 王之禹;温源;侯震;李明;;多发音字典在连续语音识别中的应用[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
2 包叶波;胡郁;刘聪;江辉;戴礼荣;刘庆峰;;中文连续语音识别系统音素建模单元集的构建[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
3 包叶波;胡郁;刘聪;江辉;戴礼荣;刘庆峰;;中文连续语音识别系统音素建模单元集的构建[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 黄泰翼;高雨青;;计算机语音识别的最新进展和展望[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
5 柴佩琪;;基于本征值的汉语音节切分方法[A];第三届全国人机语音通讯学术会议论文集[C];1994年
6 马芹;苏广川;;基于音节分割的连续语音识别方法的研究[A];第二届全国人机语音通讯学术会议论文集[C];1992年
7 那斯尔江·吐尔逊;吾守尔·斯拉木;麦麦提艾力;;维吾尔语大词汇量连续语音识别研究——语音语料库的建立[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
8 吴伟民;林道发;杨家沅;;连续密度HMM用于非特定人的汉语连续语句识别的尝试[A];第三届全国人机语音通讯学术会议论文集[C];1994年
9 谢锦辉;李晖;;大型线性预测HMM及其在汉语音素识别中的应用[A];第三届全国人机语音通讯学术会议论文集[C];1994年
10 郑方;吴文虎;方棣棠;;连续无限制语音流中关键词识别的研究现状[A];第四届全国人机语音通讯学术会议论文集[C];1996年
中国博士学位论文全文数据库 前5条
1 王坚;语音识别中的说话人自适应研究[D];北京邮电大学;2007年
2 吴斌;语音识别中的后处理技术研究[D];北京邮电大学;2008年
3 孙成立;语音关键词识别技术的研究[D];北京邮电大学;2008年
4 黄浩;基于区分性原理的汉语语音识别中声调问题的研究[D];上海交通大学;2008年
5 鄢志杰;声学模型区分性训练及其在自动语音识别中的应用[D];中国科学技术大学;2008年
中国硕士学位论文全文数据库 前10条
1 湛宗儒;连续语音识别算法研究及在嵌入式系统上的实现[D];武汉理工大学;2010年
2 徐双印;连续语音识别中的区分性训练技术[D];解放军信息工程大学;2013年
3 张利娟;基于CRF和SVM的连续语音识别研究[D];天津师范大学;2013年
4 薛小燕;基于动态贝叶斯网络的连续语音识别研究[D];解放军信息工程大学;2010年
5 武晓敏;基于Julius的维吾尔语连续语音识别研究[D];新疆大学;2012年
6 薛蕾;基于HMM和代数神经网络的连续语音识别研究[D];西北大学;2010年
7 张宝奇;基于切分的汉语连续语音识别技术研究[D];解放军信息工程大学;2010年
8 卜素亮;非特定人连续语音识别技术研究与应用[D];复旦大学;2011年
9 谢磊;连续语音识别中声学模型的建立[D];西北工业大学;2002年
10 尹明明;连续语音识别解码技术的研究[D];解放军信息工程大学;2011年
中国重要报纸全文数据库 前10条
1 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年
2 ;人机对话无障碍[N];中国计算机报;2002年
3 孙忠法;我可以选择我的成功[N];中国人事报;2006年
4 本报记者 钟洪奇;Pattek语音识别产品: 找一条走得通的路[N];计算机世界;2002年
5 本报实习记者 朱泉峰;“无求品自高”[N];计算机世界;2005年
6 冰梅;全面展现人性化设计[N];计算机世界;2000年
7 本报记者 刘学习;认准语音识别的“内核”[N];计算机世界;2002年
8 北京清华大学电子工程系副教授 刘加 教授 刘润生;让机器听懂我的话[N];科技日报;2001年
9 本报记者  文杰;李开复:一不小心成了“校园教父”[N];成都日报;2006年
10 郑千里;回家以后:他们响亮了中国之“声”[N];科技日报;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978