收藏本站
《浙江大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

情感说话人识别中的基频失配及其补偿方法研究

黄挺  
【摘要】:随着计算机技术的发展和社会信息化程度的提高,说话人识别技术具有了越来越广阔的应用前景,同时用户对说话人识别系统的准确性和鲁棒性的要求也越来越高。在实际应用环境中,说话人识别系统的性能受到很多因素的影响,情感变化是其中最为常见的一种。我们将训练或者测试语料中包含情感语音的说话人识别称为情感说话人识别,训练与测试时说话人情感状态的不一致会改变说话人个性特征的分布,从而导致测试语音与训练模型的模式不匹配,极大地降低系统的识别性能。 针对仅有中性训练语音的情感说话人识别问题,本论文从分析各种情感语音与中性语音的差异出发,以研究情感变化引发的基频失配为基础,利用基频与MFCC之间存在的关联,从情感补偿框架中的情感拓展、情感屏蔽、情感规整和得分补偿四个技术角度研究了相应的算法,来削弱情感变化对说话人识别性能的影响。 本论文的主要贡献总结如下: 1.提出了一种新的情感语音的划分与检测方法 鉴于情感检测在情感补偿方法中的重要性以及目前情感识别算法的不可靠性,本文提出了一种依据模式失配程度来划分与检测情感语音的方法,根据不同情感语音与中性语音之间的差异,将情感语音划分为高差异类(愤怒、高兴和惊慌)与低差异类(悲伤),由此提出了一种基于MFCC特征与韵律特征相结合的差异检测方法来区分这两类语音。 2.首次研究了情感变化引发的基频失配问题 从发音机制上研究了情感影响下基频失配产生的原理,分别从前人有关声源和声道之间互扰的研究、基频与MFCC的关联、基频失配与说话人识别性能间的关系三方面分析了利用基频失配来评估模式失配的可行性,并对通过修改基频降低基频失配来降低模式失配的可行性进行了详尽的实验分析。 3.首次提出并研究了基于基频失配的情感补偿方法 针对高差异类情感语音引发的模式失配问题,本文先用差异检测方法检测出该类语音,再通过拓展生成与之类似的情感语音,或者通过屏蔽、规整和得分补偿等方法消除其对系统的负面影响。具体方法如下: 1)基于基频失配检测的情感屏蔽方法 根据高差异类情感语音中基频偏高的部分相比基频偏低的部分与中性模型失配更严重这一特性,提出了基于基频失配检测的情感屏蔽方法,采用剔除和规整两种策略屏蔽语音的高失配部分,从不同程度上降低了情感测试语音与中性训练语音之间的失配程度。 2)基于基频映射的情感拓展方法 通过调节中性语音的基频均值来合成在特征分布上更接近于真实的高差异类情感的语音,以此构建说话人的“高差异类情感模型”,并将其与中性模型相结合,来提高说话人模型对多情感状态下的语音特征的描述能力。 3)基于基频修正的情感规整方法 从修正高差异类情感语音与中性语音之间的基频失配入手,通过使其基频均值趋向于中性语音来降低两者声学特征之间的不匹配程度,从而有效降低情感变化对说话人识别的影响。 4)基于基频失配评估的得分补偿方法 鉴于情感变化引发的基频失配与说话人识别率之间的相关性,以基频偏差区间内的说话人识别率作为该区间内语音帧得分的可靠性系数,依据语音高失配部分的基频均值所对应区间的可靠性系数对该部分帧得分进行加权,从而较大幅度地提高了系统的性能。
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TN912.34

手机知网App
【参考文献】
中国期刊全文数据库 前7条
1 林奕琳;韦岗;杨康才;;语音情感识别的研究进展[J];电路与系统学报;2007年01期
2 樊星;卢晶;徐柏龄;;汉语耳语音转换为正常音的研究[J];电声技术;2005年12期
3 黄挺;杨莹春;;基于情感语音的差异检测与剔除的说话人识别[J];计算机工程与应用;2008年21期
4 王亮,胡卫明,谭铁牛;基于步态的身份识别[J];计算机学报;2003年03期
5 张后旗,俞振利,张礼和;基于TD-PSOLA算法的汉语普通话韵律合成[J];科技通报;2002年01期
6 蒋丹宁;蔡莲红;;基于语音声学特征的情感信息识别[J];清华大学学报(自然科学版);2006年01期
7 李霄寒,戴蓓倩,方绍武,刘鸣;高阶MFCC的话者识别性能及其噪声鲁棒性[J];信号处理;2001年02期
中国重要会议论文全文数据库 前1条
1 蔡莲红;吴宗济;蔡锐;陶建华;;汉语韵律特征的可计算性研究[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
中国重要报纸全文数据库 前1条
1 北京大学信息科学中心视觉与听觉信息处理国家重点实验室 吴玺宏;[N];计算机世界;2001年
中国博士学位论文全文数据库 前3条
1 刘明辉;基于GMM和SVM的文本无关的说话人确认方法研究[D];中国科学技术大学;2007年
2 李冬冬;基于拓展和聚类的情感鲁棒说话人识别研究[D];浙江大学;2008年
3 许东星;基于GMM和高层信息特征的文本无关说话人识别研究[D];中国科学技术大学;2009年
中国硕士学位论文全文数据库 前1条
1 吴甜;存在情感差异性语音的说话人识别算法研究[D];浙江大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 张成武,唐瑛;简析肯定自我与否定自我及其应用[J];阿坝师范高等专科学校学报;2003年03期
2 杜黎;音乐教学中歌唱心理因素分析[J];阿坝师范高等专科学校学报;2003年03期
3 方九亿;庞靖;;孔子思想指导下的导师制[J];安徽电子信息职业技术学院学报;2008年03期
4 相征;朗朗;王静;;基于基音频能值的端点检测算法[J];安徽工程科技学院学报(自然科学版);2008年03期
5 张聪;;储粮害虫声信号编解码系统的设计与实现[J];安徽农业科学;2006年21期
6 蔡芸;论广告记忆效应的策划[J];安徽师范大学学报(人文社会科学版);1999年02期
7 陈丹;关于我国法定成年年龄标准的思考[J];安徽工业大学学报(社会科学版);2003年03期
8 刘列斌;大脑记忆规律在英语词汇教学中的运用[J];安徽工业大学学报(社会科学版);2004年02期
9 耿宁;;对普通高校女大学生体育课堂运动积极性的分析[J];安徽工业大学学报(社会科学版);2006年02期
10 韩柏光;;大学生心理危机应激源解析与疏导[J];安徽工业大学学报(社会科学版);2011年02期
中国重要会议论文全文数据库 前10条
1 边红昌;程德福;祁玉林;张坤;;基于DSP和ZigBee无线智能语音控制系统设计[A];第二十六届中国控制会议论文集[C];2007年
2 郑连递;;关于中学生心理健康问题分析及对策[A];创新沈阳文集(B)[C];2009年
3 孙秋霞;;艺术类博物馆与青少年美育[A];新世纪博物馆的实践与思考——北京博物馆学会第五届学术会议论文集[C];2007年
4 田业;贾珈;江建博;蔡莲红;;汉语普通话声调增强算法的研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
5 刘博;杨鸿武;甘振业;李曼曼;孙红英;;面向藏语机读音标SAMPA-T的字音转换[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
6 安镇宙;杨鉴;王红;余映;;一种新的基于分段排序裁剪的分层构筑DTW识别算法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
7 罗珍;董金明;;G.729语音压缩算法的研究与实现[A];全国第二届嵌入式技术联合学术会议论文集[C];2007年
8 黄高扬;贾珈;蔡莲红;;基于LPC谱的汉语韵母感知度量的研究[A];第九届中国语音学学术会议论文集[C];2010年
9 何一澜;;例析高职学生的需要结构特点与发展趋势[A];福建省高校辅导员专业委员会成立大会暨进一步加强和改进大学生思想政治教育论坛优秀论文汇编[C];2008年
10 张玲;黄鹢飞;;大学英语课堂教师情感渗透的作用[A];福建省外国语文学会2005年年会暨学术研讨会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 贲晛烨;基于人体运动分析的步态识别算法研究[D];哈尔滨工程大学;2010年
2 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
3 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
4 王立国;东北滑雪产业发展问题研究[D];东北师范大学;2010年
5 花贵如;投资者情绪对企业投资行为的影响研究[D];南开大学;2010年
6 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
7 郭戈;数字视频语义信息提取与分析[D];解放军信息工程大学;2010年
8 吴艳东;思想政治教育导向论[D];武汉大学;2010年
9 曹传清;赫德对晚清中国社会的影响[D];湖南师范大学;2010年
10 邵二辉;西南少数民族和谐人格研究[D];西南大学;2011年
中国硕士学位论文全文数据库 前10条
1 朱丽娟;拓展训练在上海市高校的开展现状与对策研究[D];上海体育学院;2010年
2 王彩霞;情绪对六年级小学生认知灵活性的影响及促进研究[D];辽宁师范大学;2010年
3 李冰;我国艺术体操集体项目技术水平发展动态与走势[D];辽宁师范大学;2010年
4 曹唯伟;基于拼音编码的水下语音通信发射端的设计与实现[D];哈尔滨工程大学;2010年
5 安金龙;哈尔滨市普通高校体育教学安全问题研究[D];哈尔滨工程大学;2010年
6 卢士鹏;基于像素级空间金字塔和乘法融合的目标跟踪[D];大连理工大学;2010年
7 韩丹丹;从注意环节的聚焦看信息接收与口译效果[D];大连理工大学;2010年
8 韩婷婷;旅游管理专业青年教师职业认同研究[D];辽宁师范大学;2010年
9 董倩;旅游管理学生专业认同研究[D];辽宁师范大学;2010年
10 张宇;基于倒谱特征的说话人识别方法研究[D];大连海事大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 徐文盛,戴蓓倩,方绍武,李辉;基于连续HMM的孤立语音鲁棒性识别方法[J];电路与系统学报;1999年04期
3 李霄寒,戴蓓倩,方绍武,刘鸣;基于子带HMM和MLP的话者确认系统的噪声鲁棒性研究[J];电路与系统学报;2002年02期
4 沙丹青,栗学丽,徐柏龄;耳语音声调特征的研究[J];电声技术;2003年11期
5 余华,王治平,赵力;语音信号中情感特征的分析和识别[J];电声技术;2004年03期
6 戴红霞,赵力;采用帧概率变换的与文本无关说话人识别系统的实现[J];电声技术;2004年09期
7 韩纪庆;邵艳秋;;基于语音信号的情感处理研究进展[J];电声技术;2006年05期
8 刘莹,李国锋;用线性预测法实现气声语音的重建[J];电声技术;1995年09期
9 赵力,将春辉,邹采荣,吴镇扬;语音信号中的情感特征分析和识别的研究[J];电子学报;2004年04期
10 詹永照,曹鹏;语音情感特征提取和识别的研究与实现[J];江苏大学学报(自然科学版);2005年01期
中国博士学位论文全文数据库 前2条
1 雷震春;支持向量机在说话人识别中的应用研究[D];浙江大学;2006年
2 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
中国硕士学位论文全文数据库 前1条
1 杨璞;基于声门特征的说话人识别研究[D];浙江大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 崔玉红,胡光锐,何旭明;基于混合进化计算的GMM优化方法及其在说话人辨认中的应用[J];应用科学学报;2002年02期
2 马建,郭建东;说话人识别技术研究[J];福建电脑;2005年01期
3 林平澜;王仁华;;动态HMM及其在说话人识别中的应用[J];信号处理;1993年04期
4 周静芳,陈一宁,李科,刘加;基于高斯语音滤波的稳健文本无关说话人识别[J];计算机工程;2005年02期
5 邓浩江,王守觉,邢藏菊,李倩;基于聚类统计与文本无关的说话人识别研究[J];电路与系统学报;2001年03期
6 余华,赵力,吴镇扬;基于FVQ的说话人识别系统的DSP实现[J];电声技术;2004年08期
7 廖贵成,罗文广;一种基于说话人识别技术的自动音量控制系统[J];桂林电子工业学院学报;2004年06期
8 韩雁,陈利华;说话人计算机识别系统的设计与实现[J];浙江大学学报(工学版);2001年02期
9 吴晓娟,韩先花,聂开宝;模糊C-均值(FCM)聚类法与矢量量化法相结合用于说话人识别[J];电子与信息学报;2002年06期
10 单进;;说话人识别技术研究[J];科技资讯;2010年21期
中国重要会议论文全文数据库 前10条
1 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
2 周静芳;陈一宁;刘润生;;一种新的说话人识别信道补偿技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
3 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
5 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
6 侯丽敏;谢娟敏;;共振峰瞬时频率特征用于说话人识别[A];第九届中国语音学学术会议论文集[C];2010年
7 吴志强;陈珂;迟惠生;;语音识别技术与说话人识别技术的结合——文本无关说话人识别的另一种方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
10 罗海风;龙长才;;多话者环境下说话人辨识听觉线索研究[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
中国重要报纸全文数据库 前10条
1 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
2 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
3 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
4 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
5 新城;小声音 大前景[N];计算机世界;2006年
6 深圳市无线电监测站 蔡伟群 中国电信集团公司 池静平;射频测量理想状况:排除不确定性失配[N];通信产业报;2004年
7 本报记者 王璐;科大讯飞:挖掘“说话”技术的商机[N];上海证券报;2008年
8 本报记者王发枝张朝晖;福建上市公司徒有虚名[N];中华工商时报;2003年
9 素萍;手机芯片市场宝座动荡[N];电子资讯时报;2002年
10 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
中国博士学位论文全文数据库 前10条
1 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年
2 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
3 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
4 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
5 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年
6 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
7 孙俊;基于激励源及其韵律特征的源—目标说话人声音转换研究[D];中国科学技术大学;2006年
8 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
9 姚志强;说话人识别中提高GMM性能方法的研究[D];中国科学技术大学;2006年
10 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
中国硕士学位论文全文数据库 前10条
1 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
2 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年
3 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
4 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
5 潘鹏;会议室环境下基于音频视频信息融合的多说话人识别[D];兰州理工大学;2011年
6 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
7 黄肖忠;基于韵律特征的SVM说话人识别[D];中国科学技术大学;2010年
8 徐良军;基于语音信号时变特性的说话人识别[D];苏州大学;2010年
9 陈文翔;面向OPHONE手机的说话人识别技术移植研究[D];浙江大学;2011年
10 吴尊敬;说话人识别中的抗噪声技术[D];清华大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026