收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

声纹身份识别中非常态语音应对方法研究

何俊  
【摘要】:随着生物信息技术迅猛发展,传统口令访问各类门禁安防系统的方式,难以满足用户对安全便捷方式的追求。而语音生物特征以获取方便,使用简单且不易被入侵等特点广泛应用于声纹身份识别领域。目前,各类声纹身份识别系统在安静环境和说话人语音正常情况下能获得较高识别率,但当面临各类非常态语音时(如:复杂背景噪声的语音、故意改变说话方式或习惯的语音、发音器官病变的语音等)其性能急剧下降。于是以非常态语音作为研究对象的语音信号处理技术受到广泛关注,并发展成为研究热点之一。 现实生活中,说话人的语音极易产生病理性非常态现象,如:感冒、反胃酸、咽喉炎、声带发炎、鼻塞、醉酒等。为提高声纹身份识别系统的普适性,降低系统对非常态语音的拒识率。本文以病理性非常态语音中的感冒语音为研究对象,探索非常态连续语音的快速检测、与文本无关的非常态连续语音中变异特征的动态加权及最优说话人共同向量提取,主要贡献如下: 1)病变非常态连续语音的检测算法。针对人为设定最优采样延迟和最优嵌入相关维的病变元音检测算法,不能客观有效地描述病变连续语音发音系统复杂性的缺陷,提出了一种基于相关维的病变非常态连续语音检测算法。通过分析信号频率,获得合理采样延迟范围,然后在合理采样延迟区间内调整采样延迟以获取相应嵌入相关维,最后对嵌入相关维进行等错率分析,将等错率最小的嵌入相关维和其对应的采样延迟视为最优混沌参数。实验结果表明:该算法的区分正确率为75.6%,分别比GMM-SVM,Shimmer,人为设定采样延迟和固定嵌入相关维算法,SHR算法和Jitter算法提高了7.8%,9.3%,16%,18%和20.4%。 2)变异特征动态加权补偿算法。针对传统加权算法难以动态跟踪各阶特征变异的缺陷,提出一种变异特征动态加权补偿的非常态语音应对算法。分别利用K-L距离和欧氏距离,动态跟踪非常态语音与常态语音特征的差异程度,并对变异特征进行加权补偿。实验结果表明:通过异常特征的K-L和欧氏加权补偿后,声纹身份识别系统对非常态语音的识别率分别为46.61%和42.25%,比传统加权算法和不加权算法的识别率分别提高6.93%、10.25%和2.57%、5.89%。当面临轻微异常语音时,经过本文的K-L加权算法处理后,系统识别率为83.77%,与传统加权算法和不加权算法相比,系统识别率分别提高了16.51%和17.53%。 3)非常态语音的最优说话人共同特征提取算法。从探索说话人常态语音和非常态语音的相对稳定,且有一定区分性的共同特征出发,引入说话人共同特征向量,并通过自适应调整共同向量参数以克服人为设定参数不客观的缺陷。提出一种非常态语音最优说话人共同特征提取算法。通过不断调整共同向量参数,使系统获得最优说话人识别率,并把最优识别率的参数视为最优共同参数。然后利用最优共同向量参数为测试语音提取共同向量,并用SVM分类器进行非常态语音说话人识别。实验结果表明:经过该算法的处理,系统的轻微非常态语音说话人识别率为85.4%,比GMM、SVM和结合共同向量和GMM算法识别率分别提高了16.9%、15.2%和3.2%。系统的非常态语音说话人整体识别率为51.8%,比GMM、SVM和结合共同向量与GMM算法的识别率分别提高了10%、8.6%和2%。 4)最小模型距离的非常态语音说话人聚类。针对传统聚类算法性能严重依赖于预先设置的最优聚类参数的缺陷(最优聚类参数往往较难获得),在使用两层相似度判决克服预先设置聚类参数算法缺陷的基础上,提出基于最小GMM距离动态追踪的非常态语音说话人聚类算法。在对说话人高斯模型进行最小巴氏距离追踪的基础上,建立疑聚类集,在对疑聚类集中的说话人语音集进行聚类时采用两层相似度说话确认。实验结果表明:本章所提算法的Fscore为69.08%,比K-means的Fscore和ISODATA算法的Fscore分别提高1.99%和0.95%。同时,采用两层相似度判决时,本章算法的平均类纯度(ACP)比一层相似度判决的提高5%,平均说话人纯度(ASP)比一层相似度判决的提高8.8%。同时,采用两层相似度判决比一层相似度判决的Fscore提高了7.08%。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 董力,陈宏钦,马争鸣;基于小波变换的语音段起止端点检测算法[J];中山大学学报(自然科学版);2005年03期
2 周曦;戴蓓蒨;陈雁翔;李辉;;基于纯度和BBN算法的无监督的话者聚类[J];模式识别与人工智能;2005年04期
3 钟山;刘加;;MLLR特征的SVM语种识别算法[J];清华大学学报(自然科学版);2009年S1期
4 张俊星;刘宇;;基于二级搜索模型的有声出版物语音分割算法[J];吉林大学学报(工学版);2009年S2期
5 卢颖;;《人民日报》元旦社论的语音修辞[J];新闻爱好者;2010年19期
6 罗元;李嘉穗;徐秉铮;;汉语语音“通—断”模型的统计分析[J];电信科学;1987年07期
7 王炜;吕萍;颜永红;;一种改进的基于层次聚类的说话人自动聚类算法[J];声学学报(中文版);2008年01期
8 谢贵武;杨继红;肖勇;闵刚;;基于语音分段的自适应时长调整算法[J];军事通信技术;2008年02期
9 肖大光;多功能数字式录音机设计[J];电子技术;1997年02期
10 李祖鹏,姚佩阳;一种语音段起止端点检测新方法[J];电讯技术;2000年03期
11 顾亚强;赵晖;吴波;;一种语音信号端点检测的改进方法[J];计算机仿真;2010年05期
12 范冰冰;荀殿栋;;模拟语音置乱保密系统的安全性[J];军事通信技术;1988年03期
13 李庆明,秦菊贤;采用单片机技术设计CAI通用智能控制器[J];华北工学院学报;1994年01期
14 赵跃进,刘海城,钱永强;单片机在小型变电站故障检测与报警中的应用[J];计算机工程与设计;1997年06期
15 孟军,陈日新;ISD语音芯片应用开发环境研究[J];计算技术与自动化;1999年01期
16 贾强;;基于51单片机的语音控制系统[J];天津科技;2009年01期
17 陈日新,孟军,李思昆;一种基于语音段管理的语音芯片体系结构设计[J];常德师范学院学报(自然科学版);1999年01期
18 张毅,唐红;用ISD器件实现现场语音分段录音与随机组合放音[J];电子技术应用;2002年03期
19 马震;李建磊;陈延萍;;基于TMS320DM6446的MELP/CELP混合编码方法研究与实现[J];电子器件;2007年06期
20 郑铁然;韩纪庆;;基于音节Lattice的汉语语音检索技术及其索引去冗余方法[J];声学学报(中文版);2008年06期
中国重要会议论文全文数据库 前10条
1 陈立春;董长宝;;具有网络监控管理功能的铁路运输语音记录仪的研究[A];《铁路车务设备信息管理系统研讨会》论文集[C];2011年
2 张金爽;于洪志;郑文思;吕士良;;言语呼吸韵律分析平台的设计与实现[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 肖熙;王侠;王作英;;非齐次HMM语音段长模型的Forward-Backward算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
5 陈凡;罗四维;;一个实用语音开发应用系统的设计与实现[A];第二届全国人机语音通讯学术会议论文集[C];1992年
6 沈亚强;程仲文;任德官;;带噪语音信号的信号模型参数和噪声模型参数的辨别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
7 李鹏伟;穆道生;唐晓刚;;基于多特征值的静音检测算法在G.729中的应用研究[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(下册)[C];2010年
8 康恒;刘文举;;基于Sinusoidal+全极点模型的语音频谱平滑[A];第八届全国人机语音通讯学术会议论文集[C];2005年
9 魏维;马海燕;;用时域及幅度域修正方法提升基于线性预测的信包丢失后重建语音信号质量[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
10 李建民;方棣棠;;语音端点检测中门限阈值的自动确定及音节切割的新判据[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
中国博士学位论文全文数据库 前10条
1 赵腊生;语音情感特征提取与识别方法研究[D];大连理工大学;2010年
2 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
3 杨于村;基于公众移动通信网的端到端加密语音传输技术研究[D];华南理工大学;2009年
4 蒋晔;基于短语音和信道变化的说话人识别研究[D];南京理工大学;2013年
5 田岚;增强电子耳蜗听感知的处理策略研究[D];天津大学;2009年
6 方瑜;语音增强相关问题研究[D];北京邮电大学;2012年
7 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年
8 周文君;舰船VDR人声识别技术研究[D];哈尔滨工程大学;2009年
9 王娜;基于小波变换与约束方差噪声谱估计的语音增强算法研究[D];燕山大学;2011年
10 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
中国硕士学位论文全文数据库 前10条
1 何明哲;语音片段检索算法的研究与应用[D];华南理工大学;2012年
2 邸燕君;基于感知哈希的语音内容认证方法研究[D];兰州理工大学;2013年
3 王冲;无人机语音指令控制系统技术研究[D];南京航空航天大学;2012年
4 郭永亮;嵌入式语音指令处理与识别方法的研究[D];南京航空航天大学;2010年
5 黄永;人工耳蜗芯片中语音增强算法的研究和实现[D];电子科技大学;2012年
6 陈英;基于语音反演机器学习方法的声道模型研究[D];南京邮电大学;2013年
7 李海忠;语音增强算法研究与应用[D];西华大学;2010年
8 班超帆;失真控制下语音增强算法的研究及DSP实现[D];重庆大学;2012年
9 陈国兴;基于音节片Lattice的语音检索关键问题研究[D];哈尔滨工程大学;2012年
10 孙红英;基于CS理论的语音增强算法的研究[D];西北师范大学;2012年
中国重要报纸全文数据库 前5条
1 江西 林慧勇;语音合成芯片MSM6295及其应用[N];电子报;2006年
2 中国科学院自动化研究所模式识别国家重点实验室 于剑陶建华;个性化语音生成技术面面观[N];计算机世界;2007年
3 ;与“小超人”对话[N];中国计算机报;2001年
4 曲豆;声纹鉴定找到敲诈人[N];北京科技报;2004年
5 上海 孙焕挺;OTP型语音电路应用[N];电子报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978