基于HHT复杂环境下低信噪比语音检测及增强方法研究
【摘要】:随着信息处理技术手段的发展,语音信号应用领域的不断扩展,对语音信号处理的要求也越来越高。如语音识别技术,要求存在背景噪声的环境下达到有效识别;语音通信技术,要求在不影响接收语音信号质量的前提下,尽可能降低无语音段的数据传输;军事上,有效截获对方的信息和高效传输信息是电子对抗的重要组成部分。然而在复杂声学环境下,由于强背景噪声的影响,使得上述情况的语音信号变得相对较微弱,如室外嘈杂环境的语音通信与识别,短波通信噪声较强情况下的信息截获等,然而,这些情况往往都是经常出现的。为此,在复杂背景情况下,能否有效地对低信噪比语音信号进行检测与增强具有重要意义。
时频分析是语音信号检测与增强的有效手段之一。传统的时频分析算法主要有短时傅里叶、小波变换等,这些算法需要根据经验人为的设定信号分解尺度,而这些尺度有时并不能完全反应出信号的特征。此外,像小波变换需要根据变换对象事先选定小波基,而固定的小波基并不一定适合整个信号的分析。据此,本文选用一种可以根据信号特征自适应选取基函数及滤波尺度的算法——希尔伯特-黄变换。该算法特别适合分析像语音信号这样的非平稳信号。
本文针对希尔伯特-黄变换在低信噪比语音信号检测及增强方面展开研究,主要研究成果如下:
首先,采用了一种基于希尔伯特-黄变换的低信噪比语音信号检测算法,解决高斯噪声环境下低信噪比语音信号的检测问题。该算法的核心思想是,利用经验模态分解的自适应分解特性,将低信噪比语音信号中噪声含量较多的固有模态分量筛分出来,通过其它固有模态分量构建希尔伯特能量谱,从而实现低信噪比语音信号的检测;
其次,提出了一种基于希尔伯特-黄变换谱矩阵的低信噪比语音信号检测算法,解决多噪声环境下低信噪比语音信号的检测问题。该算法的核心思想是,利用语音信号与噪声信号的希尔伯特-黄变换谱特征的不同,实现低信噪比语音信号的检测。在构建低信噪比语音信号的希尔伯特-黄变换谱矩阵的过程中,考虑到能量集中问题,所以采用以帧为单位,构建该信号的谱矩阵。为了更有效、直观地分析谱矩阵,提出一种三维可视化分析方法。有效地找到了语音与噪声在谱矩阵中的区别,通过该区别设定滤波参数,对矩阵实施权值滤波,滤波后将谱矩阵转换成以帧为单位的二维时-幅曲线,自适应计算阈值,实现语音段的检测;
再次,采用极值域均值模式分解算法,对经验模态分解的曲线拟合、端点效应进行了改进。该算法的核心思想是,利用信号的所有信息,构建均值曲线。在构造信号的均值曲线时,通过极值点及极值点间的所有数据,利用积分中值定理的原理,寻找一个信号中的实际存在的值作为均值,使求取的均值更能反映输入信号的真实均值,提高了对局域均值的估计精度,降低了端点效应;
再次,提出一种基于极值域均值模式分解最大相似度的低信噪比语音增强算法,解决部分噪声环境下低信噪比语音信号增强问题。该算法核心思想是,对分解后得到的固有模态分量进行筛选后再做滤波处理,以此减少过滤波和欠滤波情况的发生。在筛选过程中,提出一种最大相似度判断算法,通过检测得到的噪声信号与固有模态分量计算最大相似度,通过最大相似度筛选出固有模态分量进行滤波,由于噪声与语音信号容易发生频谱混叠,在滤波器的选择上采用时域滤波器。将滤波后的固有模态分量和未作处理的固有模态分量进行信号重构,得到增强后结果;
最后,提出了一种基于极值域均值模式分解与独立分量分析相结合的低信噪比语音增强算法,解决更多噪声环境下低信噪比语音信号增强问题。该算法的核心思想是,利用独立分量分析的特点,分离出选取的固有模态分量的固有特性,消除信息混淆。通过最大相似度,筛选出需要处理的固有模态分量,对其进行独立分量分析,使噪声特性能够进一步集中,提高最大相似度,这样更有利于噪声的滤除。由于独立分量分析存在幅值、位置的不确定性,所以对滤波后的独立分量要进行二度重构,即独立分量分析重构和极值域均值模式分解重构,得到增强后结果。
本文从复杂环境下低信噪比语音信号的希尔伯特-黄变换的特性出发,围绕着低信噪比语音信号的检测与增强,针对不同噪声环境进行了研究,提出了相应的算法,并对所提出的算法进行了性能分析和对比实验,最终解决了复杂环境下低信噪比语音信号的检测与增强。
|
|
|
|
1 |
戴启军,卞正中,陈砚圃,张介秋;基于统计模型实现语音信号有声/无声检测的研究[J];西安交通大学学报;2002年08期 |
2 |
谌璟,王福昌,刘晔莹;基于TMS320 VC5402的语音检测器[J];电讯技术;2001年06期 |
3 |
熊琦;杜旭;朱晓亮;;一种基于短时平均幅度差的语音检测算法[J];电声技术;2006年09期 |
4 |
吴坚,陈裕泉,张奕宜;具有语音输出功能的放射监测仪[J];仪表技术与传感器;1992年06期 |
5 |
韦江维,廖义奎,农建波,班世炳;数字式无线扩音系统研究[J];测控技术;2001年06期 |
6 |
阮若林,徐水秀;基于Java的网络语音信号传输的实现[J];咸宁学院学报;2004年06期 |
7 |
韩志艳;王旭;王健;;基于短时能零积和鉴别信息的语音端点检测[J];东北大学学报(自然科学版);2009年12期 |
8 |
付炜;李方胜;;小波阈值法在语音去噪中的应用[J];电子技术;2010年06期 |
9 |
李雨昕;;基于余弦过完备原子库的语音信号MP稀疏分解[J];成都电子机械高等专科学校学报;2011年02期 |
10 |
曹揆申;张良仪;於森虎;;语音的时域压缩与扩张[J];外语电化教学;1983年03期 |
11 |
荀殿栋;一个性能良好的时段置乱体制[J];信息安全与通信保密;1989年02期 |
12 |
夏晓春;林良明;;孤立语音识别系统的实验研究[J];中国医疗器械杂志;1990年02期 |
13 |
倪维桢,惠光辉,田文顺,王德隽;16kb/s LD—CELP语音编码的实时实现[J];北京电信科技;1994年06期 |
14 |
毕常青,徐子兴,谢锦辉;基于TMS302C25的语音编码系统[J];计算机应用研究;1995年02期 |
15 |
朱琦;语音信号的微机分析系统[J];南京邮电学院学报;1995年04期 |
16 |
马明,张杰,王建宇,黄志同;语音识别中隐马尔可夫模型初值的估计[J];数据采集与处理;1997年02期 |
17 |
林嘉宇,易波,王跃科;低速率语音编码体制研究[J];系统工程与电子技术;1998年11期 |
18 |
李学海;;语音效果处理器HT8950及应用[J];家用电器;1998年11期 |
19 |
戴经国;语音信号处理技术及应用[J];电脑与信息技术;2000年06期 |
20 |
李峰
,张太镒
,崔涛;基于TMS320VC5409的语音处理系统[J];电子技术;2004年02期 |
|