基于空域滤波的语音分离研究
【摘要】:现实生活中,人类能够在复杂的环境下将注意力集中于感兴趣目标的说话内容,语音分离的目的就是为了让计算机也具备这种能力,即在众多说话人背景下提取出感兴趣的一个或多个说话人的语音。麦克风阵列在时域和频域的基础上增加了空间域,为语音分离算法提供了一个新的思路,就是根据声源空间位置的不同对不同声源进行分离。本文就是按这个思路进行语音分离算法的研究,主要工作概括如下:
第一,分析了语音信号的特性和声波传播特性,在传统阵列信号处理的基础上,研究了麦克风均匀线性阵列的近场、远场信号模型。
第二,针对基于麦克风阵列的高分辨率参数估计(如MUSIC)和波束形成参数估计(如MVDR)方法在抗噪性方面的不足,利用阵列信号的稀疏性将信号稀疏分解算法应用于声源定位,通过实验仿真验证了该算法在低信噪比情况下有较好的鲁棒性,而且能够对相干信源进行定位估计;基于稀疏分解的声源定位算法是通过不同的方位参数建立原子库,并通过全局搜索寻找最佳原子,这样导致了该算法复杂度较高,计算量大,针对这一问题,使用基于近场扇区划分的匹配追踪算法,大大的减少了MP分解算法的计算量,为MP分解算法应用于实时系统提供了可能。
第三,研究了近场自适应波束形成算法,使用麦克风阵列近场模型将传统MVDR波束形成算法应用于近场环境,针对MVDR波束形成算法稳健性方面的不足,研究了近场稳健MVDR波束形成(RCB)算法,使得MVDR波束形成算法具有对导向矢量误差和有限样本效应的双重鲁棒性。
第四,结合声源定位算法和波束形成算法通过使用MATLAB仿真演示语音分离效果。
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TN912.3
|
|
|
|
1 |
雷中定,黄绣坤,张树京;一种基于神经网络的宽带相干信号波达方向估计方法[J];北方交通大学学报;1997年01期 |
2 |
刘东红,杨立明;对消除入射信号偏差的鲁棒性波束成形方法的改进[J];传感技术学报;2004年04期 |
3 |
汪晋宽,宋昕,王晗;鲁棒RLS波束形成算法[J];东北大学学报;2005年01期 |
4 |
时洁;杨德森;刘伯胜;宋海岩;;基于MVDR聚焦波束形成的辐射噪声源近场定位方法[J];大连海事大学学报;2008年03期 |
5 |
刘云,郭洁,叶芝慧,宋铁成,沈连丰;频谱重叠信号分离的循环平稳算法[J];东南大学学报(自然科学版);2005年03期 |
6 |
邓智恒;罗伟栋;;实际语音盲分离客观评价指标研究[J];电声技术;2007年09期 |
7 |
陈辉,王永良,万山虎;利用阵列几何设置改善方位估计[J];电子学报;1999年09期 |
8 |
邹红星,周小波,李衍达;时频分析:回溯与前瞻[J];电子学报;2000年09期 |
9 |
金梁,殷勤业,李盈;时频子空间拟合波达方向估计[J];电子学报;2001年01期 |
10 |
吴云韬,廖桂生,陈建峰;一种色噪声环境下的DOA估计新算法[J];电子学报;2001年12期 |
|