收藏本站
《中国科学技术大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于GMM和高层信息特征的文本无关说话人识别研究

许东星  
【摘要】: 为了考察和衡量文本无关的说话人识别的最新研究发展状况,美国国家标准与技术署(NIST)自1996年起开始举办说话人识别评测(SRE)。NIST说话人评测代表了了说话人识别领域的最先进水平,NIST设立了多项任务,探索和研究不同语音条件下的研究方法,并为各个项目提供统一的电话语音数据(多通道、多环境、说话人规模大)、测试平台、评测规则,以及评估标准。其中,采用长语音的说话人识别项目旨在利用语音信号中的高层次信息用于文本无关的说话人识别的研究,近年来,已经成为国外一些著名机构的研究热点。 语音中的高层次信息往往是与文本内容有关的,因而如何从语音中提取出用于文本无关说话人识别的高层次信息特征便成为当前研究的重点。本文对韵律、发声特点等高层次特征信息的提取方法及其用于文本无关的说话人识别进行了深入研究。 针对文本无关的说话人识别的特点,本文采用了概率统计模型的识别方法,将从与文本有关内容的语音韵律(X~t,X为语音特征)中的信息特征看作由韵律特征基元(称作超音段韵律信息特征)所组成的,通过对韵律特征基元分布的概率统计描述来实现说话人辨识。 本文提出了一种基于多尺度小波分析从韵律中提取超音段韵律特征的方法,分别用于音源FO~t和声道MFCC~t的超音段韵律特征的提取。由描述缓变信息的概貌系数和描述快变信息的细节系数组成音源FO~t的六维超音段韵律特征参数PFO;而对于高维的声道MFCC~t,由于其各维参数的近似不相关和声道缓变的特点,从MFCC各维分别提取概貌系数组成声道超音段韵律特征参数PMFCC。在NIST 06 8side数据库上的实验表明,PFO与短时FO相比,系统EER相对降低了23.66%,PMFCC达到了与短时倒谱参数MFCC相当的性能。 鉴于音源参数与声道参数的互补性,本文研究了音源超音段韵律参数PFO与声道超音段韵律参数PMFCC的组合参数PMFCCFO。PMFCCFO较MFCC在NIST06 8side数据库EER相对降低40%,在微软数据库的实验则表明了PMFCCFO有较好的噪声鲁棒性。采用PMFCCFO与短时参数MFCC的子系统输出评分线性加权后,可进一步提高系统的识别性能。NIST 08 3side评测任务中,采用了基于PMFCCFO的子系统与采用短时参数子系统的等权重输出评分加权,在电话语音条件下取得了最佳的DET曲线。 本文还对从短时倒谱中间接提取发声位置特征用于文本无关说话人识别进行了研究,提出了一种基于特征空间映射的发声位置特征的提取方法,利用大量说话人的标准语音训练得到的MLP作为所有人共享的特征映射网络,提取出发声位置参数AF。AF参数反映了说话人的发声特点,与说话人发声器官物理属性和后天发声习惯相关,含有说话人信息,具有较好的噪声鲁棒性。与短时倒谱参数MFCC组成联合参数MFCCAF后,明显改善了说话人确认系统性能的性能与鲁棒性。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TN912.34

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 赵玉晓;顾秀秀;张二华;;与文本无关说话人识别[J];计算机与数字工程;2014年02期
中国博士学位论文全文数据库 前5条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
3 高二中;对话电话语音的话者确认研究[D];中国科学技术大学;2011年
4 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年
5 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年
中国硕士学位论文全文数据库 前10条
1 朱建伟;说话人识别中特征参数的提取及优化研究[D];三峡大学;2010年
2 凌锦雯;基于多特征的说话人分割与聚类的研究[D];中国科学技术大学;2011年
3 李丽娟;基于统计模型的说话人识别研究与实现[D];电子科技大学;2010年
4 于天福;基于声音特征的动物行为识别系统研究[D];东北林业大学;2010年
5 孙振超;基于FPGA的说话人识别系统设计与实现[D];武汉理工大学;2012年
6 林子明;基于GMM和VQ的说话人识别系统的研究[D];华南理工大学;2012年
7 熊华乔;基于模型聚类的说话人识别方法研究[D];武汉理工大学;2012年
8 陈芬;无监督说话人聚类方法研究及实现[D];华南理工大学;2012年
9 曹孝玉;说话人识别中的特征参数提取研究[D];湖南大学;2012年
10 汪桃林;基于稀疏表示的短语音说话人识别[D];电子科技大学;2013年
【参考文献】
中国期刊全文数据库 前2条
1 陈继旭;刘明辉;戴蓓蒨;李辉;;文本无关说话人确认中的一种新的评分规整方法[J];信号处理;2006年04期
2 吴礼福;姚志强;戴蓓蒨;李辉;;音源特征用于提高话者确认系统的鲁棒性[J];中国科学技术大学学报;2006年05期
中国博士学位论文全文数据库 前1条
1 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 孙宪印;吴科;钱兆国;丛新军;王超;米勇;李斯深;;黄淮冬麦区北片水地组供试小麦品种(系)主要品质性状的主成分分析和聚类分析[J];山东农业科学;2006年01期
2 张奕欣;李雨萌;王安奇;;城市雨水径流污染对水环境的影响及其总量核算的研究[J];安徽科技;2010年03期
3 薛春善;尹景本;;多元统计分析棉花品质性状的研究[J];安徽农业科学;2008年13期
4 陈绘画;项云飞;杨胜利;;马尾松毛虫发生量时空回归预测的研究[J];安徽农业科学;2009年15期
5 项云飞;陈绘画;崔相富;;马尾松毛虫发生量空间定点预报模型的研究[J];安徽农业科学;2009年18期
6 黄德春;;九运会与十运会男子十项全能运动员成绩的比较分析[J];安徽师范大学学报(自然科学版);2008年04期
7 王慧;;回归系统的一种有偏估计与广义最小二乘估计的相对效率[J];安徽师范大学学报(自然科学版);2009年05期
8 王方春;李靖宇;;安徽省体育教育专业高考体育加试及相关问题分析[J];安徽师范大学学报(自然科学版);2010年05期
9 李海峰;史乃捷;王军;唐一川;马联弟;;聚类分析与稳健统计方法对CNAS T0402数据处理的比较和分析[J];现代农业科技;2009年06期
10 陈蕴谷;;基于谱减法和经验模式分解的语音增强[J];安庆师范学院学报(自然科学版);2010年01期
中国重要会议论文全文数据库 前10条
1 董静;刘健刚;;英语寂语声信号检测[A];2011'中国西部声学学术交流会论文集[C];2011年
2 李曼曼;杨鸿武;洪宁;杨硕;刘亚丽;;基于EMD的带噪语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 方杰;李英;陶泯;;语音信号的一种加权的鲁棒特征参数W_RAS_MFCC[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
5 杨威明;;基于阈值的小波变换语音增强方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
6 潘欣裕;董兴法;赵鹤鸣;;基于谱能比例加权的谱减法语音增强研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
7 王明;刘好新;张歆奕;;一种基于时频方差和的语音端点检测方法研究[A];教育部中南地区高等学校电子电气基础课教学研究会第二十届学术年会会议论文集(下册)[C];2010年
8 王红雨;廖逢钗;卢昌荆;;一种基于语音识别的普通话语音失误判别方法[A];第三届全国普通话水平测试学术研讨会论文集[C];2007年
9 陆飞;何文秀;徐春燕;;基于自相关夹角法的语音识别算法研究[A];2009中国控制与决策会议论文集(2)[C];2009年
10 王志忠;王树林;林永增;祁虹;李智峰;;黄河流域春播常规棉与杂交棉主要经济性状的差异研究[A];中国棉花学会2010年年会论文汇编[C];2010年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 杨娜;基于云参数干旱遥感监测模型与集合卡尔曼滤波的土壤湿度同化研究[D];武汉大学;2010年
3 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
4 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
5 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
6 刘青松;话者识别中失配信息补偿理论和方法研究[D];中国科学技术大学;2011年
7 梁彦霞;低速率多带激励线性预测语音编码技术的研究[D];西安电子科技大学;2011年
8 李烨;基于多带激励模型的低速率语音编码技术研究[D];西安电子科技大学;2011年
9 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
10 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
中国硕士学位论文全文数据库 前10条
1 王萍;语音情感识别研究[D];山东科技大学;2010年
2 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
3 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
4 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
5 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
6 孙大为;数字化单边带水声语音通信系统的研究与实现[D];哈尔滨工程大学;2010年
7 陈伟伟;基于鼾声检测的睡眠呼吸暂停低通气综合症诊断[D];大连理工大学;2010年
8 翟文博;基于SIP协议框架的语音通信系统的研究与设计[D];大连理工大学;2010年
9 杨炬亮;音乐背景噪声下语音增强技术的研究[D];辽宁工程技术大学;2010年
10 张宇;基于倒谱特征的说话人识别方法研究[D];大连海事大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 周昭敏,周友兵,胡锦矗,庄华,朱维,陈涛;崖沙燕繁殖期雄鸟的鸣叫行为[J];动物学杂志;2004年06期
2 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
3 吴淑珍,吴阿华;说话人识别的参量研究和语音库建设[J];北京大学学报(自然科学版);1995年03期
4 丁佩律,张立明;结合主分量分析及Fisher准则的说话人识别方法研究[J];电路与系统学报;2002年01期
5 林奕琳;韦岗;杨康才;;语音情感识别的研究进展[J];电路与系统学报;2007年01期
6 吴礼福;解焱陆;戴蓓蒨;李辉;;基于CGMM-UBM的电话短语音说话人确认[J];电路与系统学报;2007年05期
7 俞一彪;芮贤义;许允喜;;说话人语音特征子空间分离及识别应用[J];电路与系统学报;2008年01期
8 李战明,王贞;基于小波包分析特征参数的说话人识别系统[J];电声技术;2005年06期
9 张仁志,崔慧娟;基于短时能量的语音端点检测算法研究[J];电声技术;2005年07期
10 卢艳玲,侯榆青,王宾,唐升,史燕;一种基于多特征的带噪语音信号端点检测与音节分割算法[J];电声技术;2005年07期
中国重要会议论文全文数据库 前1条
1 蔡莲红;吴宗济;蔡锐;陶建华;;汉语韵律特征的可计算性研究[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
中国重要报纸全文数据库 前1条
1 北京大学信息科学中心视觉与听觉信息处理国家重点实验室 吴玺宏;[N];计算机世界;2001年
中国博士学位论文全文数据库 前10条
1 高二中;对话电话语音的话者确认研究[D];中国科学技术大学;2011年
2 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年
3 雷震春;支持向量机在说话人识别中的应用研究[D];浙江大学;2006年
4 姚志强;说话人识别中提高GMM性能方法的研究[D];中国科学技术大学;2006年
5 唐建;矢量量化码书设计与矢量量化应用研究[D];中国科学技术大学;2006年
6 孙俊;基于激励源及其韵律特征的源—目标说话人声音转换研究[D];中国科学技术大学;2006年
7 林琳;基于模糊聚类与遗传算法的说话人识别理论研究及应用[D];吉林大学;2007年
8 刘明辉;基于GMM和SVM的文本无关的说话人确认方法研究[D];中国科学技术大学;2007年
9 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
10 王坚;语音识别中的说话人自适应研究[D];北京邮电大学;2007年
中国硕士学位论文全文数据库 前10条
1 金银燕;基于时频特征的说话人识别研究[D];江南大学;2011年
2 邬晓红;噪声环境下的说话人识别研究[D];西南交通大学;2011年
3 凌锦雯;基于多特征的说话人分割与聚类的研究[D];中国科学技术大学;2011年
4 章万锋;基于PCA与LDA的说话人识别研究[D];浙江大学;2004年
5 吴甜;存在情感差异性语音的说话人识别算法研究[D];浙江大学;2006年
6 杨礼特;说话人识别系统研究与实现[D];西安电子科技大学;2006年
7 郭春霞;基于MFCC的说话人识别系统研究[D];西安电子科技大学;2006年
8 陈方泉;基于FPGA的嵌入式系统说话人识别算法的研究与实现[D];重庆大学;2007年
9 胡又文;基于FPGA的嵌入式说话人识别系统实现[D];重庆大学;2007年
10 胡益平;基于GMM的说话人识别技术研究与实现[D];厦门大学;2007年
【二级引证文献】
中国期刊全文数据库 前1条
1 花城;李辉;;使用阈值提升基频特征对话者确认的补偿性能[J];小型微型计算机系统;2014年04期
中国博士学位论文全文数据库 前1条
1 王琳琳;说话人识别中的时变鲁棒性问题研究[D];清华大学;2013年
中国硕士学位论文全文数据库 前5条
1 陈芬;无监督说话人聚类方法研究及实现[D];华南理工大学;2012年
2 张慧珊;基于声纹识别和动态密码的双因素身份认证系统的研究与实现[D];武汉理工大学;2013年
3 汪桃林;基于稀疏表示的短语音说话人识别[D];电子科技大学;2013年
4 李文;智慧家庭中声纹识别技术的研究与实现[D];东北大学;2012年
5 南洋;智能住宅门禁系统声纹识别算法研究[D];长春理工大学;2013年
【相似文献】
中国期刊全文数据库 前10条
1 马建,郭建东;说话人识别技术研究[J];福建电脑;2005年01期
2 林平澜;王仁华;;动态HMM及其在说话人识别中的应用[J];信号处理;1993年04期
3 周静芳,陈一宁,李科,刘加;基于高斯语音滤波的稳健文本无关说话人识别[J];计算机工程;2005年02期
4 邓浩江,王守觉,邢藏菊,李倩;基于聚类统计与文本无关的说话人识别研究[J];电路与系统学报;2001年03期
5 王炜,王炳锡,王波;信道补偿技术的发展及其在说话人识别上的应用[J];电声技术;2004年04期
6 余华,赵力,吴镇扬;基于FVQ的说话人识别系统的DSP实现[J];电声技术;2004年08期
7 廖贵成,罗文广;一种基于说话人识别技术的自动音量控制系统[J];桂林电子工业学院学报;2004年06期
8 韩雁,陈利华;说话人计算机识别系统的设计与实现[J];浙江大学学报(工学版);2001年02期
9 吴晓娟,韩先花,聂开宝;模糊C-均值(FCM)聚类法与矢量量化法相结合用于说话人识别[J];电子与信息学报;2002年06期
10 单进;;说话人识别技术研究[J];科技资讯;2010年21期
中国重要会议论文全文数据库 前10条
1 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
2 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
3 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
5 侯丽敏;谢娟敏;;共振峰瞬时频率特征用于说话人识别[A];第九届中国语音学学术会议论文集[C];2010年
6 周静芳;陈一宁;刘润生;;一种新的说话人识别信道补偿技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
7 吴志强;陈珂;迟惠生;;语音识别技术与说话人识别技术的结合——文本无关说话人识别的另一种方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
10 罗海风;龙长才;;多话者环境下说话人辨识听觉线索研究[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
中国重要报纸全文数据库 前10条
1 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
2 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
3 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
4 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
5 新城;小声音 大前景[N];计算机世界;2006年
6 本报记者 王璐;科大讯飞:挖掘“说话”技术的商机[N];上海证券报;2008年
7 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
8 陈泰 记者 吴长锋;安徽隆起创新人才高地[N];科技日报;2009年
9 赵海霞;语音识别能否助科大讯飞实现腾飞之梦?[N];通信信息报;2008年
10 记者 郑千里报道;我国生物识别技术研究获得进展[N];科技日报;2001年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
3 王琳琳;说话人识别中的时变鲁棒性问题研究[D];清华大学;2013年
4 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
5 方远香;基于音素分类的短语音说话人识别[D];清华大学;2012年
6 蒋晔;基于短语音和信道变化的说话人识别研究[D];南京理工大学;2013年
7 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年
8 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年
9 游大涛;基于听觉机理的鲁棒特征提取及在说话人识别中的应用[D];哈尔滨工业大学;2013年
10 张冰;人类听觉信息处理机制的心理物理学研究[D];华中科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
2 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年
3 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
4 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
5 潘鹏;会议室环境下基于音频视频信息融合的多说话人识别[D];兰州理工大学;2011年
6 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
7 徐良军;基于语音信号时变特性的说话人识别[D];苏州大学;2010年
8 陈文翔;面向OPHONE手机的说话人识别技术移植研究[D];浙江大学;2011年
9 徐海华;说话人识别方法及其系统的应用开发研究[D];华中科技大学;2004年
10 陈强;基于GMM的说话人识别系统研究与实现[D];武汉理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026