收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

在噪声环境下的说话人识别

邱政权  
【摘要】: 说话人识别的研究有几十年了,因此有些技术已经很成熟。尤其是与文本相关的说话人识别已经商品化。但是与文本无关的说话人识别,因为事先不知道文本的内容,所以就困难得多,但是这也是吸引人的地方,所以正是人们的研究热点。而且,虽然说话人识别在纯净语音环境中取得了令人满意的结果,但是一旦到了噪声环境下,说话人的识别率就会急剧地下降。这就牵涉到说话人识别系统的鲁棒性问题了。因此本文着重研究在噪声环境下的说话人识别。 本文所做的工作主要如下: (1)针对在噪声环境下的说话人识别系统做了两点改进。第一,为了提高系统的鲁棒性,通过不同尺度的小波基,把含有噪声的信号分解于不同频段中,然后在各个频段分别通过TEO(Teager能量算子)去噪。针对说话人识别的特点,在小波重构时对各小波系数进行了加权处理。再把各个频段的输出通过小波重构恢复信号。最后通过Mel滤波器组把小波系数转换成MFCC。第二,为了进一步提高识别性能和训练速度,我们在识别阶段采用了改进的OGMM(正交高斯混合模型)即把正交变换改到EM算法之前进行,这样就不必要在EM迭代过程中每次都进行正交运算了。从实验得出,采用我们提出的DWT-TEO参数对于说话人识别的效果较好。采用改进的正交高斯混合模型进一步提高了识别性能和训练速度。 (2)KLT已经成功用于与文本无关的说话人辨认的特征提取,但是对于特征矢量分解,它需要巨大的计算负担。为了减轻计算负担,把Karhunen Looeve变换(KLT)和重叠子帧合并起来用于噪声环境下的说话人辨认。基于重叠子帧的分离方法,我们提出了一种有效技术去建立特征矢量矩阵和取得KLT技术的优点的有效性。在传统的MCE方法中,对于有K个说话人的系统而言,每一类别的分类错误都需要计算K-1类的判别函数,随着K的增加,使得计算量大量增加,于是提出了一种改进的MCE模型去减少计算量,并进而提高运算速度。实验结果显示:所提出的方法确实减少了计算量,而且提高了系统的辨认率。 (3)采用了改进的小波去噪方法对含噪语音进行了前端处理,并且针对说话人识别的特点,在小波重构之前对各小波系数进行了加权处理;识别过程采用了GMM识别算法。实验结果显示,本文所提出的方法对于含噪说话人识别有着比纯粹使用MFCC作为识别特征的说话人识别有明显的优越性。所提出的方法对进行实时的说话人识别有很好的指导作用。 (4)高斯函数的线性组合能描述大量的采样分布,因此GMM具有计算的有效性和易于实现的优点,特别是在实时平台上。基于ML规则,模型参数不断更新,直到观察序列的概率的一些极限点。然而实际上,由于爬山特征,任意的原始模型参数估计通常将导致局部最优。遗传算法(GA)是近年来发展起来的强有力全局搜索工具,特别适合于求解复杂组合优化问题及非线性函数优化。提出了基于说话人识别的可以解决GMM局部最优问题GMM/GA新算法。实验结果显示,提出的GMM/GA新算法比纯粹的GMM算法能获得更优的效果。 (5)去噪的目的是去掉噪声和保留尽量重要的特征。近来,用非线性处理的信号去噪,如小波变换已越来越普遍。对于小波阈值,使用了根据估计值变量和偏差的能显示软硬阈值的半软阈值函数。GMM普遍用于说话人识别系统中,并且在宽带语音中表现出了很好的性能。然而,在噪声环境下,性能急剧下降。GMM的另一个困难是需要至少几分钟的训练语音,这对实时应用是不适用的。另一方面,ANN需更少的训练数据。所以联合概率神经网络(PNN)和GMM去提高系统的性能。试验结果显示,所提出的方法有利于噪声环境下的说话人识别。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 徐博尧;杨刚;李欣欣;;小波变换的时频分析及其在实际中的应用[J];中国传媒大学学报(自然科学版);2011年02期
2 赵立志;李辉;陈海东;魏士勇;;支持向量机在说话人识别系统中的应用[J];China's Foreign Trade;2011年14期
3 何朝霞;潘平;;说话人识别中改进的MFCC参数提取方法[J];科学技术与工程;2011年18期
4 宁向延;景昊;;二次判决的融合系统在说话人识别中的应用[J];武汉大学学报(工学版);2011年04期
5 陈继清;黄永杰;覃娟;;基于小波去噪和Hilbert-Huang变换在齿轮箱故障诊断中的应用[J];机电工程技术;2011年06期
6 陈永超;盖旭刚;张广详;;低信噪比下相位编码信号脉内特征提取的新方法[J];战术导弹技术;2011年03期
7 王媛媛;杨远洪;杨巍;;喇曼散射分布式光纤测温系统实时性的改进[J];红外与激光工程;2011年07期
8 姚红;谭敏;郭武;;音素层特征超矢量的说话人识别性能及优化[J];计算机工程与应用;2011年26期
9 刘晋胜;;采用熵相关性优化分离性的SVM说话人识别[J];计算机工程与设计;2011年08期
10 伊·达瓦;吾守尔·斯拉木;匂坂芳典;;LPC及F_0参数组合基于GMM电话语音说话人识别[J];中文信息学报;2011年04期
11 赵国建;韩宝玲;罗庆生;王鑫;;基于小波变换的光电传感器信号去噪技术[J];光通信技术;2011年07期
12 何亮;刘加;;基于线性对数似然核函数的说话人识别[J];计算机应用;2011年08期
13 何亮;史永哲;刘加;;联合因子分析中的本征信道空间拼接方法[J];自动化学报;2011年07期
14 郑泽萍;王万良;郑建炜;;基于保局部核RVM的说话人识别方法[J];计算机工程;2011年14期
15 刘宝亮;姚慧;郑海荣;吴庭万;;小波去噪在瞬时弹性成像估计中的应用[J];计算机仿真;2011年08期
16 刘帅奇;胡绍海;肖扬;;基于小波-Contourlet变换与Cycle Spinning相结合的SAR图像去噪[J];信号处理;2011年06期
17 何亮;栗志意;蔡猛;刘加;;集合分类中的鉴别式局部信息距离保持映射[J];清华大学学报(自然科学版);2011年07期
18 万统斌;段志善;;一种新的音频生命探测技术的实现[J];信息通信;2011年03期
19 张晶;;基于小波变换理论的电磁泄漏信号处理方法[J];电子质量;2011年08期
20 罗鹏;;基于非抽取Curvelet变换的图像去噪算法[J];中北大学学报(自然科学版);2011年03期
中国重要会议论文全文数据库 前10条
1 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
2 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
3 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
5 侯丽敏;谢娟敏;;共振峰瞬时频率特征用于说话人识别[A];第九届中国语音学学术会议论文集[C];2010年
6 周静芳;陈一宁;刘润生;;一种新的说话人识别信道补偿技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
7 吴志强;陈珂;迟惠生;;语音识别技术与说话人识别技术的结合——文本无关说话人识别的另一种方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
10 罗海风;龙长才;;多话者环境下说话人辨识听觉线索研究[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
3 邱政权;在噪声环境下的说话人识别[D];华南理工大学;2007年
4 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
5 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年
6 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年
7 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
8 孙俊;基于激励源及其韵律特征的源—目标说话人声音转换研究[D];中国科学技术大学;2006年
9 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
10 姚志强;说话人识别中提高GMM性能方法的研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
2 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年
3 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
4 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
5 潘鹏;会议室环境下基于音频视频信息融合的多说话人识别[D];兰州理工大学;2011年
6 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
7 徐良军;基于语音信号时变特性的说话人识别[D];苏州大学;2010年
8 陈文翔;面向OPHONE手机的说话人识别技术移植研究[D];浙江大学;2011年
9 徐海华;说话人识别方法及其系统的应用开发研究[D];华中科技大学;2004年
10 陈强;基于GMM的说话人识别系统研究与实现[D];武汉理工大学;2010年
中国重要报纸全文数据库 前10条
1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
3 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
4 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
5 新城;小声音 大前景[N];计算机世界;2006年
6 本报记者 王璐;科大讯飞:挖掘“说话”技术的商机[N];上海证券报;2008年
7 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
8 陈泰 记者 吴长锋;安徽隆起创新人才高地[N];科技日报;2009年
9 记者 郑千里报道;我国生物识别技术研究获得进展[N];科技日报;2001年
10 赵海霞;语音识别能否助科大讯飞实现腾飞之梦?[N];通信信息报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978