高噪声环境下语音激活检测技术的研究
【摘要】:
在语音信号处理中,语音激活检测技术从背景噪声中检测出信号是否含有语音,从而在语音编码中降低噪声的比特率,提高系统效率;在语音识别中提高识别精度,减少识别时间。由于现实环境中各种不确定噪声的引入和环境的改变通常会使检测性能显著下降,因此低信噪比噪声环境下鲁棒的语音激活检测已经成为目前语音处理领域的重要问题。
本文首先介绍了语音信号和噪声信号的特点及语音激活检测的基本原理,然后对现有的几种典型常用算法进行分析,随后重点研究了一种基于统计模型的语音激活检测算法。
大多数VAD算法使用高斯模型来描述带噪语音谱的分布,考虑到拉普拉斯模型更适合描述带噪语音谱的分布特点,本文将基于两种模型的算法进行对比分析。在基于统计模型的VAD算法中,先验信噪比SNR的鲁棒估计是最关键问题之一。在分析现有的定向估计法的不足后,本文使用基于软判决思想的预测估计方法对参数进行估计与更新,仿真结果表明使用该估计方法的VAD算法性能有了较大的提高。其次,本文对似然比LR的形式作出改进,引入了一种平滑形式,用幅度谱的一种更平滑的估计值代替瞬时值,并根据仿真实验确定平滑因子,提高算法的总体性能。
最后,本文对提出的算法进行总结,并提出了一些在今后的工作中需要改进的问题。