数学形态学在语音信号处理中的应用
【摘要】:语音信号是一种复杂的非线性、非平稳信号,近几年来发展并完善起来的各种非线性计算理论逐步引入到语音处理中,弥补了传统线性处理技术的不足。语音增强的主要目的是从带噪语音信号中提取尽可能纯净的原始语音信号,语音增强已经作为一种非常有效的方法用于语音识别。语音识别是当今人工智能领域的研究热点,目前,它越来越广泛地应用于社会生活的各个方面,提高了人机交互性,发挥了很好的社会效益。然而在实际环境中存在着很多不利因素影响着语音识别系统的性能。
本文重点研究了数学形态学在一维语音信号处理中的应用,依据数字语音信号的特点,设计了用于语音处理的形态滤波算法。本文还依据数学形态学和小波变换对带噪语音处理的特点,将其两者综合应用于语音去噪处理,提出了一种新的语音增强方法。实验结果表明,数学形态学和小波变换两者相结合能够有效地滤除混噪语音信号中的噪声信号。本文还将数学形态学应用到子带语音信号处理当中,提出了基于数学形态学的子带语音增强方法,该方法使用形态滤波器滤除子带语音信号中的噪声,提取出了尽可能纯净的语音。在文章的最后设计了一种新型的语音识别方法,该方法采用数学形态学和小波变换两者相结合的方法对带噪语音进行预处理,提取出尽可能纯净的原始语音信号;然后对经过预处理的语音信号进行子带特征提取,即对预处理后的语音信号采用子带特征结合的方法进行语音识别。通过大量实验结果表明,对带噪语音信号进行有效的语音增强预处理能提高语音识别率,而且在某种程度上子带语音识别相对于全带语音识别效果更好一些。