基于HMM/SVM混合架构的连续语音识别系统的研究
【摘要】:
隐马尔可夫模型对动态时间序列有很强的建模能力,在参数、结构和训练方法的选择上有很大的灵活性,成为目前主流的语音识别方法。然而,隐马尔可夫模型受极大似然准则的限制,类别区分能力较弱,其结果反映的是同类样本的相似度。支持向量机(SVM)是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,适合处理分类问题,其输出结果体现了异类样本间的差异,具有很强的分类能力。本文研究的重点就是如何将两者有机的结合起来应用到大词表、非特定人连续语音识别之中。
本文首先介绍了连续语音识别相关技术及其发展现状,然后研究了隐马尔可夫理论以及基于隐马尔可夫模型的连续语音识别系统的框架,并阐述了隐马尔可夫理论在语音识别应用方面的缺陷;接着讨论了支持向量机的统计学习理论基础及支持向量机在模式识别方面的应用,并分析了支持向量机在处理连续信号时需要解决的问题;最后将支持向量机引入基于隐马尔可夫模型的连续语音识别系统框架之中,用在语音识别的后处理方面,在对原有系统改动较小的情况下,很好的结合了两者的优势,构造了一个混合框架的HMM /SVM语音识别系统。本文使用120句863语音库语音文件作为测试集,分别在原先的连续语音识别系统和混合框架系统之下测试。测试的结果表明,该混合框架有效地提高了原有系统的音节识准确率,降低了汉字删除错误率。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TN912.3