收藏本站
《浙江大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

情感说话人识别及其解决方法的研究

单振宇  
【摘要】:说话人识别技术是使用语音中所包含的说话人特有的个性信息为生物特征,自动进行身份识别的过程。它被认为是最自然的和最经济的生物认证技术,具有广泛的应用前景。 传统的说话人识别系统在训练和测试语料都为中性语音的时候,已获得了非常出色的识别性能。然而,当用户提供的语料包含不同情感类型的语音时,由于说话人情感状态改变引起的发音方式的变化,导致训练和测试语音的特征分布不匹配,使得基于传统的说话人识别方法的系统性能急剧下降,我们把这种测试或训练语料中包含情感语音的说话人识别称为情感说话人识别。在研究了情感说话人识别技术最新进展和情感因素影响的基础上,本文紧紧围绕如何提高训练语音和测试语音之间的匹配程度这个问题,从情感拓展和情感屏蔽角度给出了有效的关键算法,构建了情感说话人识别系统的解决方案。 本文的主要贡献总结如下: 1.深入分析了情感因素对说话人识别系统的影响 文中分析了情感因素对基频和频谱分布的影响;分析了不同情感语音在特征层和模型层上对说话人个性信息的影响;分析了人耳对情感因素的鲁棒性;分析真实环境中情感因素影响存在的普遍性;分析了情感因素对说话人识别系统性能的影响。 2.研究了基于通道补偿的情感规整方法 在分析了情感、噪音和通道三个问题之间的异同后,发现解决通道噪音问题的很多思路和方法都可以应用在情感说话人识别中。冗余属性投影和隐藏因子分析是两种提高通道鲁棒性的方法,我们考察了其用于情感规整时的性能。 3.提出了两种基于中性情感模型转换算法的情感拓展方法 在实验验证了不同说话人的情感表达方式是一致的这个假设的基础上,提出了中性情感模型转换方程,建立了中性模型和情感模型的转换关系。提出了基于高斯分量和基于参数的方法来求解该转换方程,通过它可以实现中性模型到情感模型的转换,从而让系统熟悉情感语音的分布。 4.提出了一种基于频谱平移的情感拓展方法 频谱平移方法通过改变语音帧的功率谱来合成各种类型的情感语音。该方法和多状态模型的结合使用,有利于提高系统的情感鲁棒性。实验结果表明采用该方法合成的情感语音比中性语音更接近说话人真实的情感语音。它的最大优势是能很方便的和传统的说话人识别方法相结合,应用到现有的说话人识别体系中。 5.提出了一种基于得分选择的情感屏蔽方法 基于得分选择的情感屏蔽方法适用于测试语音是情感和中性语音混合的情况。在分析了不同情感比率下说话人识别系统的表现后,文中给出了两个结论:情感比率和识别性能成反比;中性特征在自身中性模型上的得分分布在较高的区域。以此为基础,通过得分选择的方法来剔除情感语音帧,降低测试语音的情感比率,提高系统性能。 6.提出了一种基于混合模型降维的方法来加速情感说话人识别 自适应方法对提高情感说话人系统性能有很大的帮助,但是高阶的通用背景模型需要极大的计算量,影响了其在真实环境中的应用。文中提出了一种基于混合模型降维的方法来降低通用背景模型的阶数,以此来提高系统的运行速度。
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TN912.34

免费申请
【参考文献】
中国期刊全文数据库 前3条
1 张磊,韩纪庆,王承发;变异语音处理的研究进展[J];电子学报;2003年03期
2 曹剑芬;基于语法信息的汉语韵律结构预测[J];中文信息学报;2003年03期
3 赵力,钱向民,邹采荣,吴镇扬;语音信号中的情感特征分析和识别的研究[J];通信学报;2000年10期
中国博士学位论文全文数据库 前3条
1 郭武;复杂信道下的说话人识别[D];中国科学技术大学;2007年
2 李冬冬;基于拓展和聚类的情感鲁棒说话人识别研究[D];浙江大学;2008年
3 雷震春;支持向量机在说话人识别中的应用研究[D];浙江大学;2006年
中国硕士学位论文全文数据库 前1条
1 吴甜;存在情感差异性语音的说话人识别算法研究[D];浙江大学;2006年
【共引文献】
中国期刊全文数据库 前7条
1 王治平,赵力,邹采荣;利用模糊熵进行参数有效性分析的语音情感识别[J];电路与系统学报;2003年03期
2 赵力,将春辉,邹采荣,吴镇扬;语音信号中的情感特征分析和识别的研究[J];电子学报;2004年04期
3 钱揖丽;荀恩东;宋柔;;基于SLM的二叉树在语音停顿预测中的应用[J];计算机工程;2006年19期
4 赵永贞 ,刘挺 ,王志伟 ,陈惠鹏 ,邵艳秋;汉语文语转换系统中停顿指数的自动标注[J];中文信息学报;2004年05期
5 刘浩杰;杜利民;;汉语韵律词F0曲线的优化[J];中文信息学报;2006年01期
6 荀恩东;钱揖丽;郭庆;宋柔;;应用二叉树剪枝识别韵律短语边界[J];中文信息学报;2006年03期
7 陈明义;余伶俐;朱晗;周昆湘;;基于特征参数融合的语音情感识别方法[J];微电子学与计算机;2006年12期
中国重要会议论文全文数据库 前4条
1 张立华;杨莹春;;情感语音变化规律的实验分析研究初步[A];第九届全国人机语音通讯学术会议论文集[C];2007年
2 王治平;何良华;赵力;邹采荣;;语音信号中情感特征的分析和识别[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年
3 杨莹春;雷震春;吴朝晖;;基于情感补偿的活体声纹识别框架研究[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年
4 蒋丹宁;蔡莲红;;基于韵律特征的汉语情感语音分类[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年
中国博士学位论文全文数据库 前9条
1 林奕琳;基于语音信号的情感识别研究[D];华南理工大学;2006年
2 雷震春;支持向量机在说话人识别中的应用研究[D];浙江大学;2006年
3 章夏芬;中国数字书法检索与作品真伪鉴别的研究[D];浙江大学;2006年
4 苏庄銮;情感语音合成[D];中国科学技术大学;2006年
5 金学成;基于语音信号的情感识别研究[D];中国科学技术大学;2007年
6 张盛;汉语语音情绪识别[D];中国科学技术大学;2007年
7 杜奕;时间序列挖掘相关算法研究及应用[D];中国科学技术大学;2007年
8 李冬冬;基于拓展和聚类的情感鲁棒说话人识别研究[D];浙江大学;2008年
9 孙爱珍;计算文体学工作模式探究[D];河南大学;2008年
中国硕士学位论文全文数据库 前10条
1 王青;基于神经网络的汉语语音情感识别的研究[D];浙江大学;2004年
2 吴甜;存在情感差异性语音的说话人识别算法研究[D];浙江大学;2006年
3 张勇;基于线谱对系数的氦语音增强算法研究[D];河北工业大学;2006年
4 张庆;基于DSP的G.729语音编码的研究[D];南京理工大学;2006年
5 郭鹏娟;语音情感特征提取方法和情感识别研究[D];西北工业大学;2007年
6 周洁;语音信号中情感信息的分析和处理研究[D];东南大学;2005年
7 吕英英;基于SPCE061A单片机的声纹识别系统研究[D];昆明理工大学;2007年
8 姚益龙;“VP+NP_1+的+NP_2”结构歧义的研究[D];首都师范大学;2007年
9 芦涛;基于SVM的汉语语音情感识别的研究[D];燕山大学;2007年
10 周健;基于粗糙集和SVM的语音情感识别[D];西南交通大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 王炜,刘峰,吴淑珍;RASTA滤波在语音通信质量客观评价中应用的研究[J];北京大学学报(自然科学版);2003年05期
2 余华,王治平,赵力;语音信号中情感特征的分析和识别[J];电声技术;2004年03期
3 史静朴,陈际,陈向东,陈川,王守觉;用神经计算机的说话人确认系统及其应用[J];电子学报;1999年10期
4 赵力,将春辉,邹采荣,吴镇扬;语音信号中的情感特征分析和识别的研究[J];电子学报;2004年04期
5 韩纪庆,王承发,高文;二阶CMS用于电话语音识别的通道补偿[J];哈尔滨工业大学学报;1998年06期
6 陈建厦,李翠华;语音情感识别的研究进展[J];计算机工程;2005年13期
7 应宏,蔡莲红;基于结构助词驱动的韵律短语界定的研究[J];中文信息学报;1999年06期
8 曹剑芬;基于语法信息的汉语韵律结构预测[J];中文信息学报;2003年03期
9 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
10 蒋丹宁;蔡莲红;;基于语音声学特征的情感信息识别[J];清华大学学报(自然科学版);2006年01期
中国重要会议论文全文数据库 前1条
1 潘胜昔;刘加;江金涛;王作英;陆大金;;基于多模式及集成判决的稳健电话语音识别算法研究[A];第五届全国人机语音通讯学术会议论文集[C];1998年
中国博士学位论文全文数据库 前3条
1 雷震春;支持向量机在说话人识别中的应用研究[D];浙江大学;2006年
2 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
3 郭武;复杂信道下的说话人识别[D];中国科学技术大学;2007年
中国硕士学位论文全文数据库 前2条
1 忻栋;支持向量机算法的研究及在说话人识别上的应用[D];浙江大学;2002年
2 杨璞;基于声门特征的说话人识别研究[D];浙江大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 马建,郭建东;说话人识别技术研究[J];福建电脑;2005年01期
2 林平澜;王仁华;;动态HMM及其在说话人识别中的应用[J];信号处理;1993年04期
3 周静芳,陈一宁,李科,刘加;基于高斯语音滤波的稳健文本无关说话人识别[J];计算机工程;2005年02期
4 邓浩江,王守觉,邢藏菊,李倩;基于聚类统计与文本无关的说话人识别研究[J];电路与系统学报;2001年03期
5 王炜,王炳锡,王波;信道补偿技术的发展及其在说话人识别上的应用[J];电声技术;2004年04期
6 余华,赵力,吴镇扬;基于FVQ的说话人识别系统的DSP实现[J];电声技术;2004年08期
7 廖贵成,罗文广;一种基于说话人识别技术的自动音量控制系统[J];桂林电子工业学院学报;2004年06期
8 韩雁,陈利华;说话人计算机识别系统的设计与实现[J];浙江大学学报(工学版);2001年02期
9 吴晓娟,韩先花,聂开宝;模糊C-均值(FCM)聚类法与矢量量化法相结合用于说话人识别[J];电子与信息学报;2002年06期
10 单进;;说话人识别技术研究[J];科技资讯;2010年21期
中国重要会议论文全文数据库 前10条
1 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
2 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
3 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
5 侯丽敏;谢娟敏;;共振峰瞬时频率特征用于说话人识别[A];第九届中国语音学学术会议论文集[C];2010年
6 周静芳;陈一宁;刘润生;;一种新的说话人识别信道补偿技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
7 吴志强;陈珂;迟惠生;;语音识别技术与说话人识别技术的结合——文本无关说话人识别的另一种方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
10 陈肖霞;王霞;;对朗读语料的音素标注与研究[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
中国重要报纸全文数据库 前10条
1 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
2 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
3 温端政;山西社科院试建“汉语俗语语料数据库”[N];中国社会科学院院报;2003年
4 记者 侯梅竹;汉语语料检索系统问世[N];计算机世界;2004年
5 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
6 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
7 佟文柱;语料更实 题材更广 语速更快[N];中国教师报;2002年
8 新城;小声音 大前景[N];计算机世界;2006年
9 陈劲宏;东方快车2003之新鲜体验[N];中国电脑教育报;2002年
10 记者 吕诺;掌握千字万词,即可看懂九成中文读物[N];新华每日电讯;2006年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
3 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
4 蒋晔;基于短语音和信道变化的说话人识别研究[D];南京理工大学;2013年
5 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年
6 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年
7 王君泽;基于大规模问答语料的问题检索系统[D];华中科技大学;2010年
8 张冰;人类听觉信息处理机制的心理物理学研究[D];华中科技大学;2012年
9 李思;WEB观点挖掘中关键问题的研究[D];北京邮电大学;2012年
10 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
中国硕士学位论文全文数据库 前10条
1 潘鹏;会议室环境下基于音频视频信息融合的多说话人识别[D];兰州理工大学;2011年
2 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
3 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年
4 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
5 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
6 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
7 徐良军;基于语音信号时变特性的说话人识别[D];苏州大学;2010年
8 陈文翔;面向OPHONE手机的说话人识别技术移植研究[D];浙江大学;2011年
9 徐海华;说话人识别方法及其系统的应用开发研究[D];华中科技大学;2004年
10 陈强;基于GMM的说话人识别系统研究与实现[D];武汉理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026