收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于拓展和聚类的情感鲁棒说话人识别研究

李冬冬  
【摘要】: 说话人识别技术是根据包含在语音波形中特有的个体信息,以声音作为生物特征,自动识别说话人身份的过程。它被认为是最自然的生物认证技术,具有广泛的应用前景。 传统说话人识别系统当系统用户在平静状态下训练、测试时,已取得了非常出色的识别性能。然而,当说话人在不同情感状态间转变时,由于说话人情绪的改变引起了发音方式的变化,使得基于中性训练语音的说话人识别系统的性能急剧下降。在综述情感语音处理现状和存在情感影响的说话人识别系统的最新进展的基础上,本文紧紧围绕如何提高训练语音和测试语音之间的情感匹配度这个问题,从情感拓展和聚类角度给出了有效的解决方案,从特征、模型和得分三个层次上提出了构建情感鲁棒的说话人识别模型的关键算法。本文的主要贡献总结如下: 1.深入分析了情感语音对说话人识别系统的影响 本文分别从文本的相关性、文本的情感性、不同训练情感语料的数量、不同建模方法、不同取得分策略以及不同背景模型等方面对存在情感差异性语音的说话人识别系统进行深入研究。针对情感语音对说话人识别系统的影响,提出了抗情感变化的说话人识别系统的建设对策以及基于拓展和聚类的情感鲁棒说话人识别模型。 2.提出了一个基于规则的特征修正方法 针对说话人情感状态转变带来的系统训练和测试时情感状态不匹配,基于规则的特征修正方法通过学习相同文本下情感语音和中性语音间的韵律参数变化规则,对系统注册用户的中性语音特征进行修正,有助于丰富训练语音的情感信息,从而较大幅度地提高了识别性能。 3.提出了一个基于情感模型间参数迁移规律的特征映射方法 本文根据模型自适应UBM-MAP方法中,背景模型与自适应得到的模型中的各个高斯分布分量之间存在一一对应关系这一显著特点,根据情感无关的通用背景模型与情感相关模型之间的参数迁移规律,通过对中性语音特征进行映射,改变中性语音的特征分布,以使训练特征具有情感语音特征的分布信息,有效提高了训练语音和测试语音之间的情感匹配度。 4.提出了一个基于情感语音聚类的说话人建模方法 根据语音特征空间分布随说话人所处的情感状态的改变而移动,本文认为相似的韵律特征变化产生了倒谱特征在空间分布上相似变形,基于情感语音聚类的说话人建模方法把韵律特征变化趋势一致的情感语音聚类一类,对说话人的情感语音分类建模。实验表明,基于情感语音聚类的说话人建模方法具有良好地表达说话人情感语音特征分布的能力。 5.提出了一个基于语音帧加权的得分规整算法 文本在研究基于语音帧的说话人系统中目标模型和非目标模型帧似然概率特性的基础上,借鉴语音帧的得分对说话人模型的排序,对得分重加权,有效地增加了正确帧的得分权重,并优化了测试语句的最终得分。同时,该方法改进了传统基于语句的得分规整方法不能提高说话人鉴别率的缺点。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 章文义,朱杰;几种无语音检测噪音估计方法的比较研究[J];计算机工程与设计;2003年10期
2 林鑫;陈桦;王开志;王继成;;语音驱动唇形自动合成算法[J];计算机工程;2007年17期
3 蔡铁;;基于在线单类支持向量机的自适应语音活动检测[J];深圳信息职业技术学院学报;2008年02期
4 章钊;郭武;;话者识别中结合模型和能量的语音激活检测算法[J];小型微型计算机系统;2010年09期
5 朱淑琴,裘雪红;一种精确检测语音端点的方法[J];计算机仿真;2005年03期
6 李艳雄;贺前华;陈楠;齐朝晖;;基于谱稳定性特征的语音与笑声区分新方法[J];电子与信息学报;2008年06期
7 高福友;陈雁翔;;一种基于说话者的无监督语音分割算法[J];合肥工业大学学报(自然科学版);2010年05期
8 Takao ,刘吉峰;语音接口[J];今日电子;1996年Z1期
9 祝庆绩,钱国荣,李治柱;面向移动电话应用的粤语语音数据库构建[J];计算机应用与软件;2004年07期
10 刘娟花;李福德;;一种改进的小波域语音去噪方法研究[J];西安工程科技学院学报;2006年01期
11 陈功;张雄伟;;一种基于灰关联分析的语音/音乐分类方法[J];声学技术;2007年02期
12 杨茂巍;郑伯川;高春梅;;基于SAPI的语音驱动口型动画方法[J];现代计算机(专业版);2012年10期
13 张振国,王晓霞;神经网络在语音音调识别中的应用研究[J];微电子学与计算机;2005年03期
14 张江安,杨洪柏,林良明,颜国正;一种基于段间距离测度的语音自动分割方法[J];上海交通大学学报;2001年09期
15 张俊星;刘宇;;基于二级搜索模型的有声出版物语音分割算法[J];吉林大学学报(工学版);2009年S2期
16 孙艳萍;戴丽玲;;通用型电梯自动语音报站系统的设计[J];制造业自动化;2012年03期
17 王志卫;徐宁;刘小峰;;一种基于码书映射的高效语音转换方法[J];微处理机;2014年01期
18 贾磊,穆向禺,徐波;广播语音的音频分割[J];中文信息学报;2002年01期
19 徐露;徐明星;杨大利;;面向情感变化检测的汉语情感语音数据库[J];清华大学学报(自然科学版);2009年S1期
20 赵智超;吴铁峰;;高保真语音录放系统的设计[J];科教文汇(上旬刊);2012年06期
中国重要会议论文全文数据库 前9条
1 田野;王作英;陆大金;;基于韵律结构信息的非语音拒识[A];第六届全国人机语音通讯学术会议论文集[C];2001年
2 徐明;胡瑞敏;黄云森;;基于音素识别的语音评价方法[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
3 王欢良;韩纪庆;李海峰;王承发;;面向嵌入式应用的小词汇量语音串识别系统[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 那斯尔江·吐尔逊;吾守尔·斯拉木;麦麦提艾力;;维吾尔语大词汇量连续语音识别研究——语音语料库的建立[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 简志华;王向文;;考虑帧间信息的语音转换算法[A];浙江省信号处理学会2012学术年会论文集[C];2012年
6 魏维;马海燕;;一种丢失语音信包重建的新算法[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
7 陈凡;罗四维;;一个实用语音开发应用系统的设计与实现[A];第二届全国人机语音通讯学术会议论文集[C];1992年
8 刘红星;戴蓓蒨;陆伟;;基于图像增强方法的共振峰谐波能量参数的语音和端点检测[A];第九届全国人机语音通讯学术会议论文集[C];2007年
9 林爱华;张文俊;王毅敏;;基于肌肉模型的语音驱动唇形动画[A];第十三届全国图象图形学学术会议论文集[C];2006年
中国博士学位论文全文数据库 前9条
1 陶冶;文本语音匹配的研究和应用[D];山东大学;2009年
2 何俊;声纹身份识别中非常态语音应对方法研究[D];华南理工大学;2012年
3 李冬冬;基于拓展和聚类的情感鲁棒说话人识别研究[D];浙江大学;2008年
4 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
5 古今;语音感知认证的关键技术研究[D];中国科学技术大学;2009年
6 彭波;Internet上语音的鲁棒性传输研究[D];华南理工大学;2001年
7 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
8 应娜;基于正弦语音模型的低比特率宽带语音编码算法的研究[D];吉林大学;2006年
9 田立斌;语音通信质量客观评价、有效接收及错误恢复算法研究[D];华南理工大学;2004年
中国硕士学位论文全文数据库 前10条
1 周慧;基于PAD三维情绪模型的情感语音转换与识别[D];西北师范大学;2009年
2 李尘一;基于联合得分的语音置信度评估系统的研究与设计[D];内蒙古大学;2006年
3 朱君波;PCA在语音检测中的应用研究[D];浙江工业大学;2004年
4 陈宇超;广播语音的分割与分类研究[D];北京邮电大学;2009年
5 何明哲;语音片段检索算法的研究与应用[D];华南理工大学;2012年
6 邸燕君;基于感知哈希的语音内容认证方法研究[D];兰州理工大学;2013年
7 杨帅;聋儿语音恢复系统的语音识别研究[D];山东大学;2009年
8 林剑峰;自主心智发育机器人的语音感知映射[D];复旦大学;2008年
9 卢红伟;基于DSP语音联合降噪系统的研究[D];南京林业大学;2009年
10 龚小燕;极低速率语音通信的实现[D];山东大学;2009年
中国重要报纸全文数据库 前5条
1 atvoc;数码语音电路产品概述[N];电子资讯时报;2008年
2 记者 李山;德用双音素改进人工语音表达[N];科技日报;2012年
3 中国科学院自动化研究所模式识别国家重点实验室 于剑陶建华;个性化语音生成技术面面观[N];计算机世界;2007年
4 江西 林慧勇;语音合成芯片MSM6295及其应用[N];电子报;2006年
5 ;与“小超人”对话[N];中国计算机报;2001年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978