收藏本站
《中国科学技术大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

复杂信道下的说话人识别

郭武  
【摘要】: 本论文研究的是复杂信道情况下的与文本无关的说话人识别问题。本论文的目标是在保证实时实现的基础上尽量提高识别率,在这篇论文中,从前端特征抽取,GMM UBM模型下的测试得分,支持向量机系统下的特征参数、正负样本选取,信道空间估计等各个方面展开了研究,提出了一系列新算法,并且获得了实验的证明,主要集中在以下几个方面: 说话人识别最常采用的是固定帧长、帧移的声学参数,这种算法中清音和浊音是同等对待的。由于清音是一种类白噪声的信号,而浊音是一种准周期的信号,反应的是说话人声道变化的情况,浊音包含有更多的说话人信息。因此,在本文中求取特征参数时不固定帧长,对浊音进行适当的加权处理。通过动态的参数处理,相对于固定帧长的参数等错误率有10%左右的下降。 说话人识别的主流算法是混合高斯模型,在测试的时候,采用的是求对数似然度的方法,本文另外提出一种采用模型距离央角的判决算法,这种算法不仅能够取得与对数似然度算法相近的识别率,而且可以与对数似然度算法的得分融合,将说话人识别的等错误率降低12%~15%。 最近几年,支持向量机在说话人识别中取得了突破性的进展。本文中从三方面改进支持向量机说话人识别系统。1)提出了将优化后的GMM的均值、权重都作为区分性模型的特征矢量,优于传统的只将均值作为特征矢量的系统,相对于基线系统性能有20%以上的提升。2)将模型距离和夹角作为支持向量机的输入参数并将其与GLDS参数结合。3)针对正负样本的平衡问题也提出基于模型距离和采用支持向量机去挑选合适的负例,采用切分的方法增加正例。 信道一直是影响说话人识别的最大因素,由于通信线路的复杂性以及话筒的多样性,会对原始的语音产生偏移,因此会导致识别性能的急剧下降。针对信道的影响,本文提出三种方法在均值超矢量空间估计信道空间:采用EM算法、主成分分析的算法和与NAP结合的PCA分析的算法,在估计出信道空间之后再通过特征映射的方法去除信道的影响,去除信道信息的系统相对于基线系统在等错误率上最多有22%以上的下降。 因子分析是解决目前信道问题的最有效算法之一,本文将相关系数的MAP与因子分析相结合,从而将因子分析的复杂度大大降低。在估计出信道空间之后,采用特征映射的方法将前端特征参数的信道信息去除,将因子分析仅仅限制在前端处理参数,保留了GMM UBM的完整框架,大大降低了计算量,而等错误率可以降低将近40%。另一方面,将因子分析与支持向量机相结合,可以取得比NAP还好的效果。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:TN912.34

手机知网App
【引证文献】
中国期刊全文数据库 前4条
1 陈红红;荀雨辰;王立石;袁野;丁匡正;陈宬;;浅谈语音领域的创造性审查[J];电声技术;2012年S1期
2 武宁;肖星星;冯瑞;;家用机器人的说话人识别系统[J];计算机工程;2012年02期
3 肖星星;冯瑞;;基于共性特征选择的短时说话人识别方法[J];计算机工程;2012年24期
4 吴海洋;杨飞然;周琳;吴镇扬;;矢量泰勒级数特征补偿的说话人识别[J];声学学报;2013年01期
中国博士学位论文全文数据库 前4条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 龙艳花;基于SVM的话者确认关键技术研究[D];中国科学技术大学;2011年
3 杨继臣;说话人信息分析及其在多媒体检索中的应用研究[D];华南理工大学;2010年
4 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
中国硕士学位论文全文数据库 前10条
1 武宁;复杂信道下的说话人识别技术[D];复旦大学;2011年
2 陈伟;信道失配条件下的话者确认研究[D];中国科学技术大学;2011年
3 顾晓江;不匹配信道下耳语音说话人识别研究[D];苏州大学;2011年
4 颜宗岳;数字波导网格模型及语音网格参数估计[D];苏州大学;2011年
5 陈晓阳;远程语音通话实时说话人确认系统研究与实现[D];厦门大学;2009年
6 陈俊;基于线谱对系数和高斯混合模型的说话人识别技术研究[D];中南大学;2009年
7 李轶杰;说话人识别中的信道补偿[D];中国科学技术大学;2009年
8 潘镭;基于混合高斯模型的说话人识别[D];中国科学技术大学;2009年
9 郭伟;基于信道补偿方法的说话人确认研究[D];中国科学技术大学;2009年
10 王敏;基于瞬时频率估计的耳语音说话人识别研究[D];苏州大学;2010年
【参考文献】
中国期刊全文数据库 前7条
1 王炜,刘峰,吴淑珍;RASTA滤波在语音通信质量客观评价中应用的研究[J];北京大学学报(自然科学版);2003年05期
2 史静朴,陈际,陈向东,陈川,王守觉;用神经计算机的说话人确认系统及其应用[J];电子学报;1999年10期
3 邓浩江,杜利民,万洪杰;似然得分归一化及其在与文本无关说话人确认中的应用[J];电子与信息学报;2005年07期
4 韩纪庆,王承发,高文;二阶CMS用于电话语音识别的通道补偿[J];哈尔滨工业大学学报;1998年06期
5 刘波;戴礼荣;王仁华;杜俊;李锦宇;;基于双高斯GMM的特征参数规整及其在语音识别中的应用[J];自动化学报;2006年04期
6 王仁华;;自动说话人识别[J];信号处理;1991年04期
7 林平澜;王仁华;;动态HMM及其在说话人识别中的应用[J];信号处理;1993年04期
【共引文献】
中国期刊全文数据库 前10条
1 刘兴远,方顺兴,姚忠国;建筑结构试验数据处理的几种方法[J];四川建筑科学研究;1993年02期
2 朱广化;半正定矩阵迹的两个不等式[J];安徽教育学院学报;2004年06期
3 张燕平;提取特征规则的重复覆盖算法(RCA)[J];安徽大学学报(自然科学版);2002年02期
4 高湘萍;吴小培;沈谦;;基于脑电的意识活动特征提取与识别[J];安徽大学学报(自然科学版);2006年02期
5 吴凤凰;;模式识别在植物叶片识别中的应用[J];安徽农业科学;2007年01期
6 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
7 管翠萍;;药物靶标G蛋白偶联受体的识别预测[J];安徽农业科学;2010年24期
8 刘婷婷;;基于支持向量机的水稻纹枯病识别研究[J];安徽农业科学;2011年28期
9 周颖,吴琼;线性多部门经济系统的经济周期问题[J];安庆师范学院学报(自然科学版);2000年02期
10 陈蕴谷;;基于谱减法和经验模式分解的语音增强[J];安庆师范学院学报(自然科学版);2010年01期
中国重要会议论文全文数据库 前10条
1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
2 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
3 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
4 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
5 蒋少华;桂卫华;阳春华;唐朝晖;蒋朝辉;;基于主元分析与支持向量机的方法及其在密闭鼓风炉过程监控诊断中的应用[A];第二十七届中国控制会议论文集[C];2008年
6 王海丰;李壮;任洪娥;赵鹏;;基于非下采样Contourlet变换和SVM的纹理图像分割算法[A];第二十九届中国控制会议论文集[C];2010年
7 ;Image Classification with Ant Colony Based Support Vector Machine[A];中国自动化学会控制理论专业委员会A卷[C];2011年
8 董静;刘健刚;;英语寂语声信号检测[A];2011'中国西部声学学术交流会论文集[C];2011年
9 晋朝勃;胡刚强;史广智;李玉阳;;一种采用支持向量机的水中目标识别方法[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
10 刘英林;刘洪鹏;査星云;宋扬;;基于SVM的热轧钢卷性能分析[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
3 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
4 柏坚;非线性数学地质模型研究及在滇东南金矿成矿预测中的应用[D];中国地质大学(北京);2010年
5 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
6 陈志国;基于群体智能的机器视觉的关键技术研究[D];江南大学;2010年
7 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
8 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
9 宋国明;基于提升小波及SVM优化的模拟电路智能故障诊断方法研究[D];电子科技大学;2010年
10 刘建明;古代壁画图像保护与智能修复技术研究[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
2 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
3 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
4 王萍;语音情感识别研究[D];山东科技大学;2010年
5 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
6 江达秀;基于HMAX模型的人脸表情识别研究[D];浙江理工大学;2010年
7 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
8 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
9 刘松;基于OCSVM和主动学习的DDOS攻击分布式检测系统[D];郑州大学;2010年
10 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 呼文亮;王惠文;;基于贝叶斯准则的支持向量机预测模型[J];北京航空航天大学学报;2010年04期
3 王勇烈;积分对Jensen不等式的隔离[J];北京联合大学学报;1994年03期
4 王逸军;低码率语音编码的线谱对实现[J];重庆邮电学院学报;1999年01期
5 李强,刘亚康,朱学勇;一种基音提取算法[J];电子科技大学学报;2000年05期
6 江铭虎,朱小燕,袁保宗;语音识别与理解的研究进展[J];电路与系统学报;1999年02期
7 赵力,邹采荣,吴镇扬;HMM在说话人识别中的应用[J];电路与系统学报;2001年03期
8 陈雪勤,赵鹤鸣,陈小平;基于计算听觉场景分析的强噪声背景下基音检测方法[J];电路与系统学报;2003年03期
9 吴礼福;解焱陆;戴蓓蒨;李辉;;基于CGMM-UBM的电话短语音说话人确认[J];电路与系统学报;2007年05期
10 熊飞;张雪英;;基于OMAP5912平台的自适应双门限语音端点检测[J];电脑开发与应用;2008年02期
中国重要会议论文全文数据库 前2条
1 袁中选;余崇智;;采用LSP参数为特征的话者识别研究[A];第二届全国人机语音通讯学术会议论文集[C];1992年
2 郭武;戴礼荣;王仁华;;采用UBM更新量的说话人确认[A];第九届全国人机语音通讯学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 龙艳花;基于SVM的话者确认关键技术研究[D];中国科学技术大学;2011年
2 吴永忠;基于物理模型的声音合成技术理论研究[D];合肥工业大学;2003年
3 郑术蓉;线性不等式约束下的EM算法[D];吉林大学;2004年
4 冯哲;基于内容的视频检索中的音频处理[D];复旦大学;2004年
5 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
6 李波;语音转换的关键技术研究[D];国防科学技术大学;2005年
7 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
8 屈丹;电话信道下语言辨识技术研究[D];中国人民解放军信息工程大学;2005年
9 郑贵滨;基于内容的音频信息检索技术研究[D];哈尔滨工业大学;2006年
10 雷震春;支持向量机在说话人识别中的应用研究[D];浙江大学;2006年
中国硕士学位论文全文数据库 前10条
1 徐婷婷;语种识别中的若干问题研究[D];北京邮电大学;2011年
2 徐颖;语种识别声学建模方法研究[D];中国科学技术大学;2011年
3 仲海兵;基于音素层信息的语种识别[D];中国科学技术大学;2011年
4 顾晓江;不匹配信道下耳语音说话人识别研究[D];苏州大学;2011年
5 黄山奇;鲁棒语言辨识关键技术研究[D];解放军信息工程大学;2011年
6 朱淑琴;语音识别系统关键技术研究[D];西安电子科技大学;2004年
7 张卫清;语音识别算法的研究[D];南京理工大学;2004年
8 王吉林;利用矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究[D];东南大学;2004年
9 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
10 张荣强;说话人识别中特征提取的方法研究[D];大连理工大学;2005年
【二级引证文献】
中国期刊全文数据库 前1条
1 刘付喜;曹坚;邹斌斌;;基于改进的神经网络异常声音自动识别系统研究[J];软件导刊;2013年04期
中国博士学位论文全文数据库 前6条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 龙艳花;基于SVM的话者确认关键技术研究[D];中国科学技术大学;2011年
3 刘青松;话者识别中失配信息补偿理论和方法研究[D];中国科学技术大学;2011年
4 何俊;声纹身份识别中非常态语音应对方法研究[D];华南理工大学;2012年
5 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
6 蒋晔;基于短语音和信道变化的说话人识别研究[D];南京理工大学;2013年
中国硕士学位论文全文数据库 前10条
1 余巍;基于排序GMM的说话人确认的研究[D];中国科学技术大学;2011年
2 顾晓江;不匹配信道下耳语音说话人识别研究[D];苏州大学;2011年
3 周芬;基于电话信道的声纹识别算法研究[D];南京理工大学;2012年
4 余丽珍;智能环境下基于音频和视频特征融合的多说话人识别[D];兰州理工大学;2012年
5 张涛;基于N谱峰突出指数的典型数字调制信号盲识别研究与实现[D];电子科技大学;2012年
6 袁磊;基于因子分析和支持向量机的耳语说话人识别[D];苏州大学;2012年
7 张力;说话人分段与聚类技术研究[D];解放军信息工程大学;2012年
8 王辉;维吾尔语声学特征分析及命令词识别系统实现[D];新疆大学;2013年
9 徐娟;清辅音特征分析及其在耳语音说话人识别中的应用[D];苏州大学;2013年
10 杨迪;基于多特征决策融合的说话人识别研究[D];华北电力大学;2013年
【二级参考文献】
中国期刊全文数据库 前5条
1 吴淑珍,邱小军;加权倒谱距离用于普通话客观音质评价[J];北京大学学报(自然科学版);1992年03期
2 吴淑珍,赵朝阳;基于听觉模型的客观音质评价方法研究[J];电子学报;1999年07期
3 徐琳,高文;基于规则的汉语至汉语手语的变换[J];哈尔滨工业大学学报;1997年06期
4 王承发,孙立新,李俊庆;基于LPC全极点模型增强算法在高噪声背景下命令语音识别的应用[J];哈尔滨工业大学学报;1998年01期
5 王守觉,鲁华祥,陈向东,曾玉娟;人工神经网络硬件化途径与神经计算机研究[J];深圳大学学报;1997年01期
【相似文献】
中国期刊全文数据库 前10条
1 崔玉红,胡光锐,何旭明;基于混合进化计算的GMM优化方法及其在说话人辨认中的应用[J];应用科学学报;2002年02期
2 马建,郭建东;说话人识别技术研究[J];福建电脑;2005年01期
3 林平澜;王仁华;;动态HMM及其在说话人识别中的应用[J];信号处理;1993年04期
4 周静芳,陈一宁,李科,刘加;基于高斯语音滤波的稳健文本无关说话人识别[J];计算机工程;2005年02期
5 邓浩江,王守觉,邢藏菊,李倩;基于聚类统计与文本无关的说话人识别研究[J];电路与系统学报;2001年03期
6 王炜,王炳锡,王波;信道补偿技术的发展及其在说话人识别上的应用[J];电声技术;2004年04期
7 余华,赵力,吴镇扬;基于FVQ的说话人识别系统的DSP实现[J];电声技术;2004年08期
8 廖贵成,罗文广;一种基于说话人识别技术的自动音量控制系统[J];桂林电子工业学院学报;2004年06期
9 韩雁,陈利华;说话人计算机识别系统的设计与实现[J];浙江大学学报(工学版);2001年02期
10 吴晓娟,韩先花,聂开宝;模糊C-均值(FCM)聚类法与矢量量化法相结合用于说话人识别[J];电子与信息学报;2002年06期
中国重要会议论文全文数据库 前10条
1 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
2 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
3 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
5 侯丽敏;谢娟敏;;共振峰瞬时频率特征用于说话人识别[A];第九届中国语音学学术会议论文集[C];2010年
6 周静芳;陈一宁;刘润生;;一种新的说话人识别信道补偿技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
7 吴志强;陈珂;迟惠生;;语音识别技术与说话人识别技术的结合——文本无关说话人识别的另一种方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
10 罗海风;龙长才;;多话者环境下说话人辨识听觉线索研究[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
中国重要报纸全文数据库 前10条
1 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
2 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
3 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
4 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
5 新城;小声音 大前景[N];计算机世界;2006年
6 本报记者 王璐;科大讯飞:挖掘“说话”技术的商机[N];上海证券报;2008年
7 陈泰 记者 吴长锋;安徽隆起创新人才高地[N];科技日报;2009年
8 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
9 赵海霞;语音识别能否助科大讯飞实现腾飞之梦?[N];通信信息报;2008年
10 记者 郑千里报道;我国生物识别技术研究获得进展[N];科技日报;2001年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
3 王琳琳;说话人识别中的时变鲁棒性问题研究[D];清华大学;2013年
4 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
5 方远香;基于音素分类的短语音说话人识别[D];清华大学;2012年
6 蒋晔;基于短语音和信道变化的说话人识别研究[D];南京理工大学;2013年
7 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年
8 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年
9 龚呈卉;基于联合因子分析的耳语音说话人识别研究[D];苏州大学;2014年
10 游大涛;基于听觉机理的鲁棒特征提取及在说话人识别中的应用[D];哈尔滨工业大学;2013年
中国硕士学位论文全文数据库 前10条
1 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
2 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年
3 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
4 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
5 潘鹏;会议室环境下基于音频视频信息融合的多说话人识别[D];兰州理工大学;2011年
6 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
7 徐良军;基于语音信号时变特性的说话人识别[D];苏州大学;2010年
8 陈文翔;面向OPHONE手机的说话人识别技术移植研究[D];浙江大学;2011年
9 徐海华;说话人识别方法及其系统的应用开发研究[D];华中科技大学;2004年
10 陈强;基于GMM的说话人识别系统研究与实现[D];武汉理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026