HMM和神经网络用于语音识别的算法研究
【摘要】:语音识别是语音信号处理领域的研究热点,它长期以来一直是一项难题,尤其是对于噪声环境下以及非特定人语音识别。为此,本文讨论了几种常用的语音识别方法包括经典的隐马尔可夫模型以及目前比较流行的人工神经网络,并引入一种新的用于抗噪的特征参数:过零率与峰值幅度特征(简称ZCPA特征)组成一个鲁棒的语音识别系统。
文中首先介绍了几种常用的特征提取方法如线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC),这两种特征在静音环境下有很好的识别效果,但在噪音环境下,性能就会严重下降。为此论文重点介绍了一种抗噪特征:ZCPA特征,并分析了其抗噪原理。接下来论文讨论了隐马尔可夫模型的原理及用于语音识别的系统实现过程。经典的Baum-Welch训练算法在软件实现中存在下溢问题,文献中没有给出正确的针对下溢问题的重估公式。因此,论文使用定标算法,重新推导了Baum-Welch训练算法的重估公式。实验结果表明修改后的公式收敛速度很快,并且得到了较好的识别效果,充分证明了重新推导后公式的正确性,而使用原公式在训练时无法收敛。然后
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|