希尔伯特—黄变换及其在语音增强中的应用研究
【摘要】:
语音增强是在带噪语音信号中提取出语音信息的方法,在语音识别与编码、语音通信等领域中有着广泛的应用。语音增强的算法多种多样,经典的信号去噪声方法如时域、频域、加窗傅里叶变换、小波变换等各自有其局限性,因此限制了它们的应用范围。希尔伯特-黄变换是近年发展起来的处理非线性非平稳随机信号的有力的信号分析理论,具有重要的理论价值和广阔的应用前景,已在信号去噪领域获得了有效的应用。
本文首先介绍了常用的非平稳信号的时频分析方法,总结了希尔伯特-黄变换的基本理论、研究背景、存在的问题、研究现状,以及在各研究领域尤其是信号去噪领域的应用情况。在此基础上将信息熵和主成分分析原理引入希尔伯特-黄变换中,针对传统经验模态分解的终止条件的不足,给出了希尔伯特时频谱熵的算法以及基于时频谱熵的分量终止准则和基于主成分分析的分解终止准则,并对经验模态分解算法进行了改进。改进的经验模态分解算法能够得到更准确的分解结果,并且在一定程度上减少了虚假分量和模态混叠的产生。
本文对受加性噪声污染的语音信号增强理论和方法做了研究,分析了噪声和语音的分解特性,提出了一种新的基于希尔伯特-黄变换的语音端点检测算法和基于希尔伯特-黄变换的自适应多尺度多阈值的语音增强算法。采用希尔伯特-黄变换的经验模态分解方法将含噪语音分解为不同尺度的分量的和,针对每个分量的特性来进行语音检测,有选择的逐一进行去噪处理,并重构得到增强的语音信号。实验结果表明,该算法在低信噪比的多种噪声条件下对于多数语音样本具有较好的语音增强效果,并且与基于小波变换的语音增强方法比较,具有一定的优越性。