听觉特性与鲁棒语音识别算法研究
【摘要】:
语音识别技术了开创人机交互的新纪元,它被广泛应用于工业、军事、商业、金融、服务、医疗、日常生活等很多领域。在实际应用中,由于环境不匹配,导致识别系统的性能急剧恶化。因而,语音识别的环境鲁棒性成为目前鲁棒语音识别研究的热点和难点。论文先后研究了目前语音识别以及鲁棒语音识别技术、人耳的听觉特性、语音识别中采用的估计准则、噪声环境对语音识别影响的途径,并根据人耳的感知特性、不同频带信号及噪声的功率谱差异,以及噪声对不同频带识别模型影响的不同,先后采用不同的模型框架、估计准则、匹配方法、可信度信息分析,提出多种鲁棒语音识别算法,改进了现有的鲁棒语音识别算法。
模型分析与补偿技术是目前噪声环境下鲁棒语音识别研究的重要途径。在大量的理论分析与研究的基础上,论文研究了基于Fletcher-Allen规则的子带框架下的语音识别算法。提出了并行子带HMM最大后验概率自适应非线性类估计算法和非线性最大后验统计匹配鲁棒语音识别算法。在并行子带HMM最大后验概率自适应非线性类估计算法中提出了MAP估计、环境映射以及BP网络联合做非线性映射分类的方法。该算法在信号信息可信度上采用了信噪比分析,算法中还提出了有效反映噪声环境的先验信息估计方法。在非线性最大后验统计匹配算法中,提出了依信噪比进行MAP统计匹配并联合非线性映射进行分类的算法。实验表明,研究获得了不同程度识别性能的改进。
基于听觉特性流组合的研究,论文研究了基于噪声污染假定的多带鲁棒语音识别算法。论文研究了多带异步处理模式下的鲁棒语音识别算法。首先,论文提出了多带最大似然鲁棒语音识别算法。该算法提出基于多带模式进行最大似然估计以及线性判别分析或联合信噪比及模型近似度判决分析的鲁棒语音识别方法。论文根据多带分析的特点,还提出了判决多带最大后验多变换算法以及它的简化算法(平均估计和JamesStein估计)。该算法采用多带处理、判别分析、MAP估计,以及信息多变换等,从多种角度提取识别信息获得了非常好的性能。论文还提出了联合信噪比和模型近似度判别分析的思想和具体处理方法,并对提出的几种可靠信息合并准则进行了比较实验。
研究表明,鲁棒语音识别应该是基于可信信息抽取的,也就是说不同频带信号的处理模式应该是同步、异步交织进行。为此,论文在前面多带异步处理的基础上,提出了多带同步鲁棒语音识别算法,可以看到同步信息的利用可以大大简化模型。然后综合同步、异步问题的研究,提出了同步-异步语音识别模型,并联合对语音信号随机删除下语音识别性能的分析,研究了时变-频变噪声环境下的基于信噪比可信度判决的迭代识别结构。
论文中大量的理论分析和仿真实验比较表明,根据听觉感知中表现的频率特性、信号及
|
|
|
|
1 |
程庆祥;;语音识别电路简介[J];家电科技;1990年02期 |
2 |
张连海,韩华,王炳锡;过零周期转移概率矩阵语音识别方法的改进[J];信息工程学院学报;1994年01期 |
3 |
闫守华;语音控制系统的研制[J];成都气象学院学报;1997年03期 |
4 |
李晓霞,王东木,李雪耀;语音识别技术评述[J];计算机应用研究;1999年10期 |
5 |
李虎生,刘加,刘润生;利用多层感知机映射提高不匹配环境下的语音识别性能[J];电路与系统学报;1999年04期 |
6 |
陈海英,于金辉;利用语音识别进行信息检索[J];情报学报;2003年01期 |
7 |
刘占军;;我的Word更“听话”[J];电脑知识与技术(经验技巧);2010年10期 |
8 |
赵显富;;译者的话[J];计算技术与自动化;1985年04期 |
9 |
张忠平;文成义;;基于BP神经网络的汉语语音识别的研究[J];电声技术;1992年09期 |
10 |
战普明,王作英,陆大 ;语音识别隐马尔可夫模型的改进[J];电子学报;1994年01期 |
11 |
戎月莉;语音识别的二值化时频图型模糊匹配法[J];应用声学;1994年05期 |
12 |
姚萝姑;有限词汇、特定人、商品化的英语语音识别系统[J];上海交通大学学报;1996年06期 |
13 |
David Haskin
,贾树山;DragonDictate使语音识别迈上新台阶[J];个人电脑;1996年09期 |
14 |
吴少军 ,张维平 ,沈永福;新型语音识别电路AP7003及其应用[J];电子技术应用;2001年07期 |
15 |
徐金甫,韦岗,梁树雄;一种基于奇异值分解的带噪语音识别方法[J];华南理工大学学报(自然科学版);2001年01期 |
16 |
刘芝;;语音识控 走向应用[J];科技潮;2001年07期 |
17 |
张会清,于洪珍;语音识别及自组织映射神经网络的应用[J];计算机工程与应用;2002年19期 |
18 |
唐昌文;一种孤立字语音识别的新方法[J];通信技术;2002年08期 |
19 |
李远志,李浮滨;语音技术在信息产业的应用展望[J];现代情报;2003年04期 |
20 |
张杰;告别键盘、鼠标 与计算机人性化交流[J];中国计算机用户;2004年39期 |
|