收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于韵律特征的SVM说话人识别

黄肖忠  
【摘要】: 语音信号是用于个人身份确认的一种有效的生物特征,与文本无关的说话人识别的研究也是语音信号处理的一个重要的研究方向,其研究具有重要的理论意义和广泛的应用前景。为了考察最新的相关研发进展,并提供统一的衡量标准,美国国家标准技术研究院(NIST)于1996年起开始主持说话人识别评测。NIST说话人评测代表了说话人识别领域的最高水准,NIST设立了多项评测任务,探索和尝试各种语音条件下的研究方法,并为各个项目指定统一的电话和广播语音(多环境、多通道、大规模说话人)、测试基准、评测规则和标准。其中一个任务是采用长语音进行说话人识别,是为了探索用于与文本无关的说话人识别的语音信号高层次信息而设置的。 除了短时倒谱参数,语音中的高层次信息也是一种有效的说话人特征参数,但其通常与文本内容有关,因此研究从信号中提取可用于与文本无关说话人识别的语音高层次特征信息就成了目前研究的焦点。本文对韵律的提取方法及其与区辨模型结合运用于与文本无关的说话人识别进行了探讨。 从与文本无关的说话人识别的特点出发,本文先讲述概率统计模型,从文本相关的语音韵律(语音特征随时间变化的轨迹)中提取的特征信息,进行数据压缩、聚类,再利用支持向量机SVM进行区分。 文章提出了一种基于小波分析从韵律中提取超音段韵律信息的方法,分别从声道的MFCC轨迹和基频轨迹,时域能量轨迹中进行超音段韵律特征的提取。由MFCC各维参数的近似不相关和声道缓变的特点,MFCC轨迹的韵律特征只以概貌系数来刻画,提取的PMFCC作为主参数,在参数级和由基频F0轨迹的六维韵律特征参数PF0、由时域能量轨迹的六维韵律特征参数PE,组成更加有效的PMFCCFE参数,进而利用支持向量机SVM模型进行区分。 在NIST数据库上的实验表明,与传统的短时MFCC的GMM-UBM系统相比,超音段韵律特征PMFCCFE的GMM-SVM系统的EER相对下降了57.9%,MinDCF相对下降了41.4%。显著提高了说话人识别的性能。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 马建,郭建东;说话人识别技术研究[J];福建电脑;2005年01期
2 林平澜;王仁华;;动态HMM及其在说话人识别中的应用[J];信号处理;1993年04期
3 周静芳,陈一宁,李科,刘加;基于高斯语音滤波的稳健文本无关说话人识别[J];计算机工程;2005年02期
4 邓浩江,王守觉,邢藏菊,李倩;基于聚类统计与文本无关的说话人识别研究[J];电路与系统学报;2001年03期
5 王炜,王炳锡,王波;信道补偿技术的发展及其在说话人识别上的应用[J];电声技术;2004年04期
6 余华,赵力,吴镇扬;基于FVQ的说话人识别系统的DSP实现[J];电声技术;2004年08期
7 廖贵成,罗文广;一种基于说话人识别技术的自动音量控制系统[J];桂林电子工业学院学报;2004年06期
8 韩雁,陈利华;说话人计算机识别系统的设计与实现[J];浙江大学学报(工学版);2001年02期
9 吴晓娟,韩先花,聂开宝;模糊C-均值(FCM)聚类法与矢量量化法相结合用于说话人识别[J];电子与信息学报;2002年06期
10 单进;;说话人识别技术研究[J];科技资讯;2010年21期
11 戴红霞,赵力;采用帧概率变换的与文本无关说话人识别系统的实现[J];电声技术;2004年09期
12 武妍,金明曦,王洪波;基于KL-小波包分析的文本无关的说话人识别[J];计算机工程与应用;2005年04期
13 刘雅琴,杜海明;基于矢量量化的说话人识别[J];洛阳师范学院学报;2005年05期
14 刘云冰;彭静;吴传菊;肖俊;祝彦成;;基于HMM的说话人识别[J];科技创业月刊;2007年04期
15 陈炜杰;姚明海;;PLAR在噪声环境下说话人识别中的应用[J];中国新通信;2008年09期
16 檀蕊莲;;基于VQ的说话人识别技术研究[J];信息技术;2010年08期
17 尉洪,周浩,杨鉴;基于矢量量化的组合参数法说话人识别[J];云南大学学报(自然科学版);2002年02期
18 张玲华,杨震,郑宝玉;基于HMM的说话人辨认系统及其改进[J];电讯技术;2003年06期
19 王吉林;利用矢量量化的说话人识别系统的研究[J];安徽工业大学学报(自然科学版);2005年03期
20 陆小珊,王俊法,田岚;音高特征在说话人识别中的可分性及应用研究[J];山东大学学报(工学版);2005年04期
中国重要会议论文全文数据库 前10条
1 ;A Tool Wear Predictive Model Based on SVM[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
2 ;A CDMA Signal Receiver Based on LS-SVM[A];第二十六届中国控制会议论文集[C];2007年
3 司爱威;冯辅周;江鹏程;饶国强;王建;;基于可变风险SVM模型的故障识别方法研究[A];第十届全国振动理论及应用学术会议论文集(2011)上册[C];2011年
4 王红伟;董慧;;一种提高SVM分类精度的调制信号识别方法[A];2010年西南三省一市自动化与仪器仪表学术年会论文集[C];2010年
5 ;Improved Particle Swarm Optimized SVM for Short-term Traffic Flow Predication[A];第二十六届中国控制会议论文集[C];2007年
6 宋鑫颖;周志逵;;一种基于SVM的主动学习文本分类方法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 邵杰;叶宁;容亦夏;;基于SVM的多波束测深数据滤波[A];第二十九届中国控制会议论文集[C];2010年
8 于湘涛;周峰;张兰;魏超;;基于SVM和田口方法的石英挠性加速度计健壮性设计[A];质量——持续发展的源动力:中国质量学术与创新论坛论文集(下)[C];2010年
9 ;Adaptive Control of Nonlinear System Based on SVM Online Algorithm[A];中国自动化学会控制理论专业委员会D卷[C];2011年
10 张睿;陈雪;马建文;;基于递归SVM的高光谱数据特征选择算法研究[A];第八届成像光谱技术与应用研讨会暨交叉学科论坛文集[C];2010年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
3 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
4 申丰山;样例权重估计及在此基础上的SVM[D];西安电子科技大学;2011年
5 宋国明;基于提升小波及SVM优化的模拟电路智能故障诊断方法研究[D];电子科技大学;2010年
6 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
7 张婧;基于SVM的肺结节自动识别方法研究[D];华南理工大学;2011年
8 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年
9 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年
10 龙艳花;基于SVM的话者确认关键技术研究[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 黄肖忠;基于韵律特征的SVM说话人识别[D];中国科学技术大学;2010年
2 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
3 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年
4 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
5 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
6 潘鹏;会议室环境下基于音频视频信息融合的多说话人识别[D];兰州理工大学;2011年
7 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
8 徐良军;基于语音信号时变特性的说话人识别[D];苏州大学;2010年
9 陈文翔;面向OPHONE手机的说话人识别技术移植研究[D];浙江大学;2011年
10 严会霞;基于SVM的眼动轨迹解读思维状态的研究[D];太原理工大学;2010年
中国重要报纸全文数据库 前10条
1 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
2 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
3 郭涛;利用SVM虚拟化技术实现容灾[N];中国计算机报;2008年
4 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
5 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
6 新城;小声音 大前景[N];计算机世界;2006年
7 本报记者 王璐;科大讯飞:挖掘“说话”技术的商机[N];上海证券报;2008年
8 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
9 本报记者 韩露;乱军之中智者胜[N];证券时报;2000年
10 陈泰 记者 吴长锋;安徽隆起创新人才高地[N];科技日报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978