语音识别中的抗噪声技术
【摘要】:
目前的语音识别系统对纯净语音可以达到非常高的识别精度,但是无处不在噪声带来了训练模型和测试语音之间的失配,识别器的性能在噪声环境中将会急剧下降。因此抗噪声问题是语音识别达到真正实用所必须解决的关键问题。
加性背景噪声对语音识别影响非常大。论文工作的贡献之一是提出了一种基于语音增强失真补偿的算法,通过对多种抗噪声算法的有效融合来提高系统在背景噪声中的稳健性。在信号空间,利用语音增强有效抑制噪声,提高输入信号中的鉴别信息,但增强带来的语音失真和增强后的剩余噪声是对语音识别非常不利的因素。分析表明,语音失真和剩余噪声可近似看作乘性噪声和加性噪声,因此可在模型空间利用并行模型合并(PMC)算法通过调整模型参数对剩余噪声进行补偿,或者在特征空间利用倒谱均值归一化(CMN)算法对语音失真和剩余噪声同时进行补偿。从另一角度看,PMC和CMN算法在中等信噪比条件下最为有效,因此语音增强在前端的消噪过程将促进PMC和CMN算法对系统稳健性的提高。对多空间算法的有效融合能显著提高系统在噪声环境,特别是低信噪比情况下的识别精度。
随着无线通信和计算机通信的迅速发展,对冲激噪声下稳健语音识别技术的研究成为一个新的热点。通过对Viterbi译码过程的分析,得出冲激噪声对语音识别的影响在于其引入了不可靠的概率差距。针对该结论,论文提出了在高斯分量级对噪声敏感特征子向量的观测概率进行限值,从而直接消除冲激噪声对语音识别的影响。特征划分和门限取值是该算法的两个关键问题。论文提出了衡量各维特征噪声敏感度的方法,并根据分析结果对特征向量作合理的划分。针对敏感特征的门限取值,论文提出了一种近似算法,将多维高斯分布的积分转换为级数求和,而且计算得到的门限和最佳门限值非常接近。合理的特征划分和最佳门限的指定将使得在有效消除概率差距的同时,保留更多的识别信息。该算法能够显著提高系统在冲激噪声环境中的识别率,并保持对纯净语音的高识别率。计算量小以及对噪声特性依赖性低则是该算法在实际应用中的优点。
|
|
|
|
1 |
程庆祥;;语音识别电路简介[J];家电科技;1990年02期 |
2 |
张连海,韩华,王炳锡;过零周期转移概率矩阵语音识别方法的改进[J];信息工程学院学报;1994年01期 |
3 |
闫守华;语音控制系统的研制[J];成都气象学院学报;1997年03期 |
4 |
李晓霞,王东木,李雪耀;语音识别技术评述[J];计算机应用研究;1999年10期 |
5 |
李虎生,刘加,刘润生;利用多层感知机映射提高不匹配环境下的语音识别性能[J];电路与系统学报;1999年04期 |
6 |
陈海英,于金辉;利用语音识别进行信息检索[J];情报学报;2003年01期 |
7 |
刘占军;;我的Word更“听话”[J];电脑知识与技术(经验技巧);2010年10期 |
8 |
赵显富;;译者的话[J];计算技术与自动化;1985年04期 |
9 |
张忠平;文成义;;基于BP神经网络的汉语语音识别的研究[J];电声技术;1992年09期 |
10 |
战普明,王作英,陆大 ;语音识别隐马尔可夫模型的改进[J];电子学报;1994年01期 |
11 |
戎月莉;语音识别的二值化时频图型模糊匹配法[J];应用声学;1994年05期 |
12 |
姚萝姑;有限词汇、特定人、商品化的英语语音识别系统[J];上海交通大学学报;1996年06期 |
13 |
David Haskin
,贾树山;DragonDictate使语音识别迈上新台阶[J];个人电脑;1996年09期 |
14 |
吴少军 ,张维平 ,沈永福;新型语音识别电路AP7003及其应用[J];电子技术应用;2001年07期 |
15 |
徐金甫,韦岗,梁树雄;一种基于奇异值分解的带噪语音识别方法[J];华南理工大学学报(自然科学版);2001年01期 |
16 |
刘芝;;语音识控 走向应用[J];科技潮;2001年07期 |
17 |
张会清,于洪珍;语音识别及自组织映射神经网络的应用[J];计算机工程与应用;2002年19期 |
18 |
唐昌文;一种孤立字语音识别的新方法[J];通信技术;2002年08期 |
19 |
李远志,李浮滨;语音技术在信息产业的应用展望[J];现代情报;2003年04期 |
20 |
张杰;告别键盘、鼠标 与计算机人性化交流[J];中国计算机用户;2004年39期 |
|