收藏本站
《华南理工大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

声纹身份识别中非常态语音应对方法研究

何俊  
【摘要】:随着生物信息技术迅猛发展,传统口令访问各类门禁安防系统的方式,难以满足用户对安全便捷方式的追求。而语音生物特征以获取方便,使用简单且不易被入侵等特点广泛应用于声纹身份识别领域。目前,各类声纹身份识别系统在安静环境和说话人语音正常情况下能获得较高识别率,但当面临各类非常态语音时(如:复杂背景噪声的语音、故意改变说话方式或习惯的语音、发音器官病变的语音等)其性能急剧下降。于是以非常态语音作为研究对象的语音信号处理技术受到广泛关注,并发展成为研究热点之一。 现实生活中,说话人的语音极易产生病理性非常态现象,如:感冒、反胃酸、咽喉炎、声带发炎、鼻塞、醉酒等。为提高声纹身份识别系统的普适性,降低系统对非常态语音的拒识率。本文以病理性非常态语音中的感冒语音为研究对象,探索非常态连续语音的快速检测、与文本无关的非常态连续语音中变异特征的动态加权及最优说话人共同向量提取,主要贡献如下: 1)病变非常态连续语音的检测算法。针对人为设定最优采样延迟和最优嵌入相关维的病变元音检测算法,不能客观有效地描述病变连续语音发音系统复杂性的缺陷,提出了一种基于相关维的病变非常态连续语音检测算法。通过分析信号频率,获得合理采样延迟范围,然后在合理采样延迟区间内调整采样延迟以获取相应嵌入相关维,最后对嵌入相关维进行等错率分析,将等错率最小的嵌入相关维和其对应的采样延迟视为最优混沌参数。实验结果表明:该算法的区分正确率为75.6%,分别比GMM-SVM,Shimmer,人为设定采样延迟和固定嵌入相关维算法,SHR算法和Jitter算法提高了7.8%,9.3%,16%,18%和20.4%。 2)变异特征动态加权补偿算法。针对传统加权算法难以动态跟踪各阶特征变异的缺陷,提出一种变异特征动态加权补偿的非常态语音应对算法。分别利用K-L距离和欧氏距离,动态跟踪非常态语音与常态语音特征的差异程度,并对变异特征进行加权补偿。实验结果表明:通过异常特征的K-L和欧氏加权补偿后,声纹身份识别系统对非常态语音的识别率分别为46.61%和42.25%,比传统加权算法和不加权算法的识别率分别提高6.93%、10.25%和2.57%、5.89%。当面临轻微异常语音时,经过本文的K-L加权算法处理后,系统识别率为83.77%,与传统加权算法和不加权算法相比,系统识别率分别提高了16.51%和17.53%。 3)非常态语音的最优说话人共同特征提取算法。从探索说话人常态语音和非常态语音的相对稳定,且有一定区分性的共同特征出发,引入说话人共同特征向量,并通过自适应调整共同向量参数以克服人为设定参数不客观的缺陷。提出一种非常态语音最优说话人共同特征提取算法。通过不断调整共同向量参数,使系统获得最优说话人识别率,并把最优识别率的参数视为最优共同参数。然后利用最优共同向量参数为测试语音提取共同向量,并用SVM分类器进行非常态语音说话人识别。实验结果表明:经过该算法的处理,系统的轻微非常态语音说话人识别率为85.4%,比GMM、SVM和结合共同向量和GMM算法识别率分别提高了16.9%、15.2%和3.2%。系统的非常态语音说话人整体识别率为51.8%,比GMM、SVM和结合共同向量与GMM算法的识别率分别提高了10%、8.6%和2%。 4)最小模型距离的非常态语音说话人聚类。针对传统聚类算法性能严重依赖于预先设置的最优聚类参数的缺陷(最优聚类参数往往较难获得),在使用两层相似度判决克服预先设置聚类参数算法缺陷的基础上,提出基于最小GMM距离动态追踪的非常态语音说话人聚类算法。在对说话人高斯模型进行最小巴氏距离追踪的基础上,建立疑聚类集,在对疑聚类集中的说话人语音集进行聚类时采用两层相似度说话确认。实验结果表明:本章所提算法的Fscore为69.08%,比K-means的Fscore和ISODATA算法的Fscore分别提高1.99%和0.95%。同时,采用两层相似度判决时,本章算法的平均类纯度(ACP)比一层相似度判决的提高5%,平均说话人纯度(ASP)比一层相似度判决的提高8.8%。同时,采用两层相似度判决比一层相似度判决的Fscore提高了7.08%。
【学位授予单位】:华南理工大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TN912.34

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 何俊;贺前华;张清华;孙国玺;肖明;左敬龙;;基于共同向量的非常态语音说话人识别算法[J];计算机工程与科学;2014年08期
【参考文献】
中国期刊全文数据库 前10条
1 张磊,韩纪庆,王承发;变异语音处理的研究进展[J];电子学报;2003年03期
2 陈果;;非线性时间序列的动力学混沌特征自动提取技术[J];航空动力学报;2007年01期
3 徐利敏;唐振民;何可可;钱博;;基于自适应直方图均衡化的鲁棒性说话人辨认研究[J];自动化学报;2008年07期
4 文颖;施鹏飞;;一种基于共同向量结合2DPCA的人脸识别方法[J];自动化学报;2009年02期
5 赵力,钱向民,邹采荣,吴镇扬;语音信号中的情感识别研究[J];软件学报;2001年07期
6 金赟;赵艳;黄程韦;赵力;;耳语音情感数据库的设计与建立[J];声学技术;2010年01期
7 王素品,万明习,倪小珂,钱明;病变语音信号的谐波噪声比分析[J];西安交通大学学报;1996年09期
8 张家騄;超音段特征间的相互作用[J];声学学报;1993年04期
9 邹原,万明习,牛海军,赵守国,王素品;嗓音源谐波噪声独立分量分离估计方法[J];声学学报;2001年06期
10 吕成国,韩纪庆,王承发;动态时间规正与差别子空间相结合的变异语音识别方法[J];声学学报;2005年03期
中国博士学位论文全文数据库 前5条
1 唐发明;基于统计学习理论的支持向量机算法研究[D];华中科技大学;2005年
2 刘明辉;基于GMM和SVM的文本无关的说话人确认方法研究[D];中国科学技术大学;2007年
3 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
4 任双桥;支撑矢量机理论与应用研究[D];国防科学技术大学;2006年
5 杨继臣;说话人信息分析及其在多媒体检索中的应用研究[D];华南理工大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 冉志红;李乔;单德山;唐亮;;影响矩阵法在南京长江三桥状态识别中的应用[J];四川建筑科学研究;2008年04期
2 张德祥;吴小培;卢一相;;EMD在汽车变速齿轮箱振动故障分析的应用[J];安徽大学学报(自然科学版);2009年02期
3 薛蕊;;一类线性混合模型中方差分量的估计[J];安庆师范学院学报(自然科学版);2010年02期
4 李新海;;双反对称矩阵的性质分析与推广[J];白城师范学院学报;2007年06期
5 斯彩英;;关于左、右伪逆矩阵的阶数递推算法[J];保定学院学报;2008年02期
6 秦翰林;周慧鑫;刘上乾;杨廷梧;;基于奇异值分解的红外弱小目标背景抑制[J];半导体光电;2009年03期
7 高经纬,张培林,任国全,李峰,赵晖;遗传算法在油液光谱分析诊断系统中的应用[J];兵工自动化;2004年03期
8 方新;谷明喜;;基于VXI总线的某防空导弹发控系统故障检测[J];兵工自动化;2009年10期
9 程广利;蔡志明;;改进的层次分析法在水下信息战人才胜任力评估中的应用[J];兵工自动化;2010年03期
10 辛怡;陶然;王越;;多重分数阶傅里叶变换在Shamir三次传递协议中的应用[J];兵工学报;2008年06期
中国重要会议论文全文数据库 前10条
1 姚智颖;刘冬;;基于Kazakov线性化的迭代滤波[A];第二十九届中国控制会议论文集[C];2010年
2 逄海萍;王璐萍;;一类不确定仿射非线性系统的鲁棒近似最优滑模控制[A];第二十九届中国控制会议论文集[C];2010年
3 周洁;;基于高斯混合模型的情感语音转换[A];2011'中国西部声学学术交流会论文集[C];2011年
4 查星云;;一种钢铁企业金属损耗平衡分析方法[A];全国冶金自动化信息网2012年年会论文集[C];2012年
5 陈雁翔;;汉语情感语音数据库的设计与测试[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
6 刘文峰;张劲泉;何玉珊;魏忠;;公路桥梁健康与安全监测系统的进展[A];第九届全国振动理论及应用学术会议论文集[C];2007年
7 沙志超;彭耿;徐神;黄知涛;;基于信号子空间维数估计的单通道盲信号检测[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
8 董杰;孙怡;;一种高频谱效率的OFDM载波频偏盲估计方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
9 张艳红;都赟赟;付铁连;;一种基于分布式USFC-OFDM的异步协同传输技术[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(下册)[C];2008年
10 尹敏;;工程机械远程故障诊断及维护系统构架[A];全国城市公路学会第十九次学术年会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 范迪;沉渣厚度超声检测信号处理技术研究及应用[D];山东科技大学;2010年
2 殷复莲;同步CDMA系统NBI识别及抑制技术研究[D];哈尔滨工程大学;2010年
3 于志明;无线通信系统中的信号识别技术研究[D];哈尔滨工程大学;2010年
4 李关防;模态域信号处理在水声中的应用[D];哈尔滨工程大学;2009年
5 刘德铸;声学多普勒流速测量关键技术研究[D];哈尔滨工程大学;2010年
6 于蕾;OFDM系统的信道估计技术研究[D];哈尔滨工程大学;2009年
7 郭文卓;多天线多用户通信系统关键技术研究[D];哈尔滨工程大学;2009年
8 王文标;基于视觉测量的快速再制造成形系统关键技术研究[D];大连海事大学;2010年
9 黄伟国;基于振动信号特征提取与表达的旋转机械状态监测与故障诊断研究[D];中国科学技术大学;2010年
10 张进;宽带阵列信号波达方向估计算法研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 王萍;语音情感识别研究[D];山东科技大学;2010年
2 蒋静;基于子空间的二阶统计量盲信道辨识算法研究[D];郑州大学;2010年
3 赵金平;基于矩阵变换的MIMO-OFDM系统信号检测[D];郑州大学;2010年
4 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
5 刘萍萍;灾难现场人手部分检测方法研究[D];哈尔滨工程大学;2010年
6 巩俊;语音信号欠定盲源分离技术的研究[D];大连理工大学;2010年
7 邹向琪;间歇式反应釜温度控制系统故障诊断研究[D];大连理工大学;2010年
8 田向伟;基于参数优化LSSVM在转炉煤气系统预测中的应用[D];大连理工大学;2010年
9 柳永娟;数字音频真实性鉴定的研究[D];大连理工大学;2010年
10 唐科威;基于洛伦兹流形的特征提取算法研究[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前3条
1 张磊,韩纪庆,王承发;变异语音处理的研究进展[J];电子学报;2003年03期
2 何俊;李艳雄;贺前华;李威;;变异特征加权的异常语音说话人识别算法[J];华南理工大学学报(自然科学版);2012年03期
3 文颖;施鹏飞;;一种基于共同向量结合2DPCA的人脸识别方法[J];自动化学报;2009年02期
【二级参考文献】
中国期刊全文数据库 前10条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 王勇烈;积分对Jensen不等式的隔离[J];北京联合大学学报;1994年03期
3 李霄寒,戴蓓倩,方绍武,刘鸣;基于子带HMM和MLP的话者确认系统的噪声鲁棒性研究[J];电路与系统学报;2002年02期
4 沙丹青,栗学丽,徐柏龄;耳语音声调特征的研究[J];电声技术;2003年11期
5 周洁,赵力,邹采荣;情感语音合成的研究[J];电声技术;2005年10期
6 樊星;卢晶;徐柏龄;;汉语耳语音转换为正常音的研究[J];电声技术;2005年12期
7 韩纪庆;邵艳秋;;基于语音信号的情感处理研究进展[J];电声技术;2006年05期
8 高学,金连文,尹俊勋,黄建成;一种基于支持向量机的手写汉字识别方法[J];电子学报;2002年05期
9 王守觉;仿生模式识别(拓扑模式识别)——一种模式识别新模型的理论与应用[J];电子学报;2002年10期
10 李昆仑,黄厚宽,田盛丰;模糊多类SVM模型[J];电子学报;2004年05期
中国重要会议论文全文数据库 前3条
1 潘胜昔;刘加;江金涛;王作英;陆大金;;基于多模式及集成判决的稳健电话语音识别算法研究[A];第五届全国人机语音通讯学术会议论文集[C];1998年
2 马永林;韩纪庆;张磊;王承发;;基于修正Mel频率映射的应力影响下变异语音识别方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
3 吴西愉;孔江平;;基于小波变换的汉语耳语分析[A];第六届全国现代语音学学术会议论文集(上)[C];2003年
中国博士学位论文全文数据库 前7条
1 冯哲;基于内容的视频检索中的音频处理[D];复旦大学;2004年
2 郑贵滨;基于内容的音频信息检索技术研究[D];哈尔滨工业大学;2006年
3 刘明辉;基于GMM和SVM的文本无关的说话人确认方法研究[D];中国科学技术大学;2007年
4 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
5 王坚;语音识别中的说话人自适应研究[D];北京邮电大学;2007年
6 郭武;复杂信道下的说话人识别[D];中国科学技术大学;2007年
7 李艳雄;自然口语语音中非文字音频事件检测方法研究[D];华南理工大学;2009年
中国硕士学位论文全文数据库 前2条
1 李默;新闻视频场景分割技术研究[D];中国人民解放军信息工程大学;2005年
2 张箭;基于内容的新闻视频检索系统研究[D];西安电子科技大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 董力,陈宏钦,马争鸣;基于小波变换的语音段起止端点检测算法[J];中山大学学报(自然科学版);2005年03期
2 周曦;戴蓓蒨;陈雁翔;李辉;;基于纯度和BBN算法的无监督的话者聚类[J];模式识别与人工智能;2005年04期
3 钟山;刘加;;MLLR特征的SVM语种识别算法[J];清华大学学报(自然科学版);2009年S1期
4 张俊星;刘宇;;基于二级搜索模型的有声出版物语音分割算法[J];吉林大学学报(工学版);2009年S2期
5 卢颖;;《人民日报》元旦社论的语音修辞[J];新闻爱好者;2010年19期
6 罗元;李嘉穗;徐秉铮;;汉语语音“通—断”模型的统计分析[J];电信科学;1987年07期
7 王炜;吕萍;颜永红;;一种改进的基于层次聚类的说话人自动聚类算法[J];声学学报(中文版);2008年01期
8 谢贵武;杨继红;肖勇;闵刚;;基于语音分段的自适应时长调整算法[J];军事通信技术;2008年02期
9 肖大光;多功能数字式录音机设计[J];电子技术;1997年02期
10 李祖鹏,姚佩阳;一种语音段起止端点检测新方法[J];电讯技术;2000年03期
中国重要会议论文全文数据库 前10条
1 陈立春;董长宝;;具有网络监控管理功能的铁路运输语音记录仪的研究[A];《铁路车务设备信息管理系统研讨会》论文集[C];2011年
2 张金爽;于洪志;郑文思;吕士良;;言语呼吸韵律分析平台的设计与实现[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 肖熙;王侠;王作英;;非齐次HMM语音段长模型的Forward-Backward算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
5 陈凡;罗四维;;一个实用语音开发应用系统的设计与实现[A];第二届全国人机语音通讯学术会议论文集[C];1992年
6 沈亚强;程仲文;任德官;;带噪语音信号的信号模型参数和噪声模型参数的辨别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
7 李鹏伟;穆道生;唐晓刚;;基于多特征值的静音检测算法在G.729中的应用研究[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(下册)[C];2010年
8 康恒;刘文举;;基于Sinusoidal+全极点模型的语音频谱平滑[A];第八届全国人机语音通讯学术会议论文集[C];2005年
9 魏维;马海燕;;用时域及幅度域修正方法提升基于线性预测的信包丢失后重建语音信号质量[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
10 李建民;方棣棠;;语音端点检测中门限阈值的自动确定及音节切割的新判据[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
中国重要报纸全文数据库 前5条
1 江西 林慧勇;语音合成芯片MSM6295及其应用[N];电子报;2006年
2 中国科学院自动化研究所模式识别国家重点实验室 于剑陶建华;个性化语音生成技术面面观[N];计算机世界;2007年
3 ;与“小超人”对话[N];中国计算机报;2001年
4 曲豆;声纹鉴定找到敲诈人[N];北京科技报;2004年
5 上海 孙焕挺;OTP型语音电路应用[N];电子报;2003年
中国博士学位论文全文数据库 前10条
1 赵腊生;语音情感特征提取与识别方法研究[D];大连理工大学;2010年
2 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
3 杨于村;基于公众移动通信网的端到端加密语音传输技术研究[D];华南理工大学;2009年
4 蒋晔;基于短语音和信道变化的说话人识别研究[D];南京理工大学;2013年
5 田岚;增强电子耳蜗听感知的处理策略研究[D];天津大学;2009年
6 方瑜;语音增强相关问题研究[D];北京邮电大学;2012年
7 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年
8 周文君;舰船VDR人声识别技术研究[D];哈尔滨工程大学;2009年
9 王娜;基于小波变换与约束方差噪声谱估计的语音增强算法研究[D];燕山大学;2011年
10 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
中国硕士学位论文全文数据库 前10条
1 何明哲;语音片段检索算法的研究与应用[D];华南理工大学;2012年
2 邸燕君;基于感知哈希的语音内容认证方法研究[D];兰州理工大学;2013年
3 王冲;无人机语音指令控制系统技术研究[D];南京航空航天大学;2012年
4 郭永亮;嵌入式语音指令处理与识别方法的研究[D];南京航空航天大学;2010年
5 黄永;人工耳蜗芯片中语音增强算法的研究和实现[D];电子科技大学;2012年
6 陈英;基于语音反演机器学习方法的声道模型研究[D];南京邮电大学;2013年
7 李海忠;语音增强算法研究与应用[D];西华大学;2010年
8 班超帆;失真控制下语音增强算法的研究及DSP实现[D];重庆大学;2012年
9 陈国兴;基于音节片Lattice的语音检索关键问题研究[D];哈尔滨工程大学;2012年
10 孙红英;基于CS理论的语音增强算法的研究[D];西北师范大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026