收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

话者识别中失配信息补偿理论和方法研究

刘青松  
【摘要】:在文本无关的话者识别中,尤其以NIST话者测评为代表的复杂环境下电话手机语音的话者识别,训练语音与测试语音的失配是导致识别系统性能下降的重要因素。这种失配包含语音类失配和外部干扰失配两种:包括训练和测试文本内容不同的影响,周围环境噪声的影响,语音信号采集设备(话筒)的影响,传输调制信道的影响等。除此之外,还有说话人自身因素的影响,情绪变化等。如何对这些失配信息进行准确而有效的补偿是当前话者识别研究领域的热点问题。 论文针对复杂环境下电话手机语音识别系统的失配问题,围绕如何解决当前失配方法的不足,更加有效的对上述两种失配进行补偿,如何提高训练和测试失配补偿的速度,如何将失配补偿与区分性系统结合起来等方面进行了深入的研究。 论文首先深入分析了现有的一些失配补偿方法的思路和算法实现细节。针对语音类失配问题,从训练和测试两个角度详细分析了在GMM-UBM框架下UBM模型在话者模型训练和评分测试中所起到的重要的基准作用,以及通过测验语音与目标话者模型和UBM模型的评分相减来解决语音类失配的问题。针对外部影响失配问题,详细介绍了现有的一些基于特征域、模型域、评分域的失配补偿方法,并分析了这些失配补偿方法的不足之处,主要体现在需要信道分类器对语音进行信道判决,只能针对孤立的信道类别进行补偿,以及信道分类器判决可能出现误判,训练信道分类器也需要相应的信道标记的语音。这都限制了当前已有的一些失配补偿方法的效果。 论文针对语音类和外部干扰两类失配问题和现有失配补偿方法存在的不足之处,将因子分析方法用于估计说话人确认中训练和测试受到的失配影响,详细分析了在基于因子分析的失配补偿方法中,如何构建失配信息空间和话者信息空间,并通过这两个信息空间估计语音所受到的失配影响大小(对应为失配因子),其失配补偿是按照实际的失配影响大小而不是通道类别进行补偿,无需利用信道模型判决语音的信道种类,避免信道种类判决错误的影响。故其连续相对的补偿效果要优于传统的失配补偿方法。在NIST SRE 2008测评中我们将本方法应用于长语音任务中,在50多家国际参赛机构中排名第一。论文还利用话者信息空间解决短语音利用MAP方法据估计话者模型的不足问题,实验结果效果明显,相对提高17%左右。 为了提高语音在失配补偿时的速度,论文提出了一种基于CUBM选择模型和因子分析的快速失配补偿方法。CUBM由UBM高斯分量通过KL距离准则和自底向上的分层聚类得到的高斯混合模型。在失配补偿时,利用CUBM选择模型为每帧语音特征矢量选择一组相应的UBM高斯分量,只用这些高斯分量计算相应的EM统计量,可以显著降低失配补偿的计算量。论文还提出了一种基于Top-N的选择策略,以提高UBM高斯分量的选择精度,平衡系统性能和失配补偿计算量之间的矛盾。在NIST SRE 2006主任务上的实验表明,基于CUBM选择模型的快速失配补偿方法在取得和原始失配补偿方法相近的系统性能的同时,计算量降为原来的八分之一左右,解决了失配补偿方法应用中的计算量问题。 论文提出将失配补偿和SVM区分性话者识别系统结合起来的一种方法。当SVM输入是GMM均值超矢量时,SVM的训练样本(目标和冒认话者的GMM均值超矢量)在模型域进行补偿,测试时,测试语音也同样提取相应的GMM均值超矢量,在模型域补偿后与SVM话者模型测试。在NIST SRE 2008核心任务的实验表明,失配补偿后的SVM系统性能比补偿后的GMM系统性能有7%左右的提高,比补偿前的SVM系统性能相对提高24%。实验结果充分说明了失配补偿方法对区分性话者识别系统性能提升的重要意义。 论文的研究工作得到了国家留学基金委2009年度国家公派高水平研究生项目(No.2009634072)和中国科学技术大学研究生创新基金(No.KD2008056)的资助。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 谢成学;对K分布加高斯分布杂波的最佳和失配检测[J];雷达科学与技术;1998年04期
2 胡兵;李平安;俞卞章;;异步DS-CDMA系统盲空时信道估计及多用户检测[J];电子与信息学报;2006年06期
3 马绍宇;韩雁;黄大海;;三阶级联ΣΔ调制器的行为级建模[J];杭州电子科技大学学报;2007年05期
4 朱军;李健一;王增浩;;低反射系数等效信号源的测试方法研究[J];中国测试技术;2008年03期
5 成钢;;膨胀系数匹配对表面贴装组件的可靠性影响[J];质量与可靠性;2010年06期
6 唐斌;邓宏;张强;税正伟;刘忠华;;ZnO纳米棒与Si(111)和Si(100)衬底的外延关系(英文)[J];微纳电子技术;2011年04期
7 吕伟锋;孙玲玲;;模拟电路MOSFET晶体管失配研究:模型和参数[J];固体电子学研究与进展;2011年02期
8 邓方,何培宇,吴景田,徐自励;立体声回波对消的算法性能实验研究及DSP实现的可行性分析[J];四川大学学报(自然科学版);2005年05期
9 何培宇;夏秀渝;;多路声回波对消中基于时基微扰的去互相关法的研究[J];四川大学学报(工程科学版);2007年01期
10 王兰成;C/S前后端语言的支持与失配[J];微电脑世界;1996年11期
11 高文,马继涌;基于统计推断和矢量量化的非特定文本话者识别方法[J];计算机学报;1998年S1期
12 李霄寒,戴蓓倩,方绍武,刘鸣;高阶MFCC的话者识别性能及其噪声鲁棒性[J];信号处理;2001年02期
13 罗岚,赵光永,吴建辉,时龙兴;MOSFET失配的研究现状与进展[J];电子器件;2004年04期
14 汪海;一种基于RASTA-PLP分析的话者识别技术[J];电声技术;2002年05期
15 杨春;电缆失配点的反射[J];电视技术;1998年11期
16 张锡英,李光琪,张艳秋;隐马尔柯夫模型在话者识别中的应用[J];佳木斯大学学报(自然科学版);2000年01期
17 张一平;王子欧;;锁存型灵敏放大器电路的改进设计[J];苏州大学学报(工科版);2008年01期
18 刘鸣,戴蓓倩,李辉,陆伟,李霄寒;鲁棒性话者辨识中的一种改进的马尔科夫模型[J];电子学报;2002年01期
19 张奇,苏鸿根;基于高斯混合模型的乐器识别方法[J];计算机工程;2004年18期
20 袁中选,徐柏龄,余崇智;基于模糊神经网络的话者辩认研究[J];声学学报(中文版);1997年04期
中国重要会议论文全文数据库 前10条
1 袁中选;余崇智;;采用LSP参数为特征的话者识别研究[A];第二届全国人机语音通讯学术会议论文集[C];1992年
2 陈峰;赵铁军;尚福华;李生;;文本无关的话者识别中基于SVM的判别策略研究[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
3 郭楠;陶霖密;胡起秀;;用于话者识别的有效语音实时提取[A];第四届和谐人机环境联合学术会议论文集[C];2008年
4 崔景旭;洪韩;王欣;张艳云;;话者自动识别系统及其应用[A];第九届中国语音学学术会议论文集[C];2010年
5 闫宝杰;高文;;一种使用非限定词句的话者识别的系统[A];第三届全国人机语音通讯学术会议论文集[C];1994年
6 杨伟东;陈永彬;;用于话者识别的一种自适应端点自动检测方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年
7 黄益旺;杨士莪;朴胜春;宋扬;;基于声线传播时间匹配场处理的失配研究[A];2005年全国水声学学术会议论文集[C];2005年
8 李春明;宋新亮;;代码风格所引起形式验证失配问题的分析[A];第五届中国测试学术会议论文集[C];2008年
9 杨坤德;邹士新;雷波;马远良;;环境失配的降阶自适应匹配场算法研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
10 陈飞;郑建勇;张先飞;梁志成;傅静波;江峰;;EMI滤波器阻抗失配问题研究[A];江苏省电工技术学会成立十周年庆典暨2004年学术年会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 刘青松;话者识别中失配信息补偿理论和方法研究[D];中国科学技术大学;2011年
2 朱亮;力学性能失配焊接接头的强度及变形行为[D];兰州理工大学;2005年
3 白树忠;欠定盲源分离算法及在语音处理中的应用研究[D];山东大学;2008年
4 李爱红;中继卫星高速数传系统中发射端数字信号处理技术研究[D];国防科学技术大学;2008年
5 吴光林;多通道时间交叉ADC校准技术研究及实现[D];东南大学;2006年
6 叶凡;多通道时间交织模数转换器的校正与集成电路实现方法研究[D];复旦大学;2010年
7 幺周石;相干激光空间数据传输系统及其多阶波前校正研究[D];电子科技大学;2010年
8 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年
9 苏文华;光学倍频过程中感应衍射及色散的研究[D];复旦大学;2006年
10 陈庆;浅水低频合成孔径声纳:信号处理及系统实现[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 李宗霖;TIADC系统时钟失配FMC校准算法及FPGA实现[D];电子科技大学;2012年
2 范建俊;分时交替ADC时钟失配数字校准设计与FPGA实现[D];电子科技大学;2011年
3 舒凯;与文本无关话者识别算法研究及其DSP系统实现[D];西安理工大学;2005年
4 张一平;深亚微米灵敏放大器设计[D];苏州大学;2008年
5 沈晓斌;CMMB射频接收机基带增益控制环路和直流失配抑制电路研究[D];上海交通大学;2011年
6 吴杰;基于高斯混合模型的话者识别系统的研究[D];吉林大学;2008年
7 宋丹;基于信号失配处理的自适应抗干扰技术研究[D];哈尔滨工业大学;2010年
8 倪志博;反离散余弦变换的失配问题及其定点实现的设计[D];浙江大学;2007年
9 吴宽;无源网络插入衰减器的最小失配网络的研究[D];大连海事大学;2011年
10 陈茹梅;高速高性能时间交叉采样模数转换系统[D];西安电子科技大学;2006年
中国重要报纸全文数据库 前10条
1 深圳市无线电监测站 蔡伟群 中国电信集团公司 池静平;射频测量理想状况:排除不确定性失配[N];通信产业报;2004年
2 本报记者王发枝张朝晖;福建上市公司徒有虚名[N];中华工商时报;2003年
3 山东省章丘市畜牧局 邢攸荷;母貉受胎率低的原因及对策[N];河北科技报;2006年
4 中国农科院特产研究所 魏海军(研究员);水貂养殖:抓好冬季关键期管理[N];河北科技报;2006年
5 本报记者 王淼;专家认为盲目性加深中国城市特色危机[N];中国改革报;2007年
6 李大刚;司机修车“五防”[N];山西科技报;2001年
7 关键;新世纪抗老10大利器[N];新疆科技报(汉);2001年
8 课题组组长 杨忠直 课题组成员 杜德军 姚林如 李莉;就业难:产业资本与劳动力失配[N];中国信息报;2007年
9 大江;大学生就业难凸显结构失衡[N];中国改革报;2006年
10 郭长佑;电池管理新技术[N];电子资讯时报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978