收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于话者统计特征和SVM的文本无关话者确认研究

许敏强  
【摘要】:随着信息化地不断深入,话者确认等身份识别方法越来越受到人们的重视。话者确认,尤其是用户界面友好的与文本无关的话者确认,以其广阔的市场前景,吸引了越来越多的研究人员的重视,成为目前研究的重点。 话者确认是一个分类问题。支持向量机(Support Vector Machine,SVM)是一种分类能力很强的分类器,目前在模式分类中运用广泛。但是,SVM是一种针对小样本的机器学习算法,在处理需要较长语音的文本无关话者确认时,面临着短时特征矢量样本数量大、数据混叠严重、目标话者和冒人话者样本数量不平衡等问题。此外,SVM只考虑分类面上的支持向量,而单一帧短时特征缺少话者整体信息,因此基于短时特征的SVM话者确认还面临着单一帧缺乏话者特征信息的问题。这些问题制约了SVM用于话者确认,影响了基于SVM的话者确认的性能。 针对SVM用于文本无关话者确认存在的问题,本文提出了基于统计信息的话者特征提取方法,将大样本的、混叠严重的、单一帧缺乏话者整体信息的短时特征转化为小样本的、高维的、具有话者整体信息、适合SVM建模的统计话者特征,运用于SVM话者建模,提高了与文本无关的话者确认的性能。 本文提出了一种基于概率分布泰勒展开的话者统计特征提取方法,采用各阶泰勒展开项的微商部分作为话者统计特征。泰勒公式(Taylor’s theorem)表明可以用函数某点的各阶导数值重构该点邻域内的该函数。在话者确认问题上,对于两个语音观测序列,通过比较两个话者特征概率分布函数在同一点处的各阶泰勒展开项的微商值,可以确定这两个GMM是否相同,从而判定这两个语音观测序列是否属于同一个人。用GMM拟合话者短时倒谱参数的概率分布,然后对GMM进行泰勒展开,求取GMM的各阶泰勒展开项的微商值作为话者统计特征。此话者统计特征代表了话者特征概率分布函数的特性。此方法能够将短时特征转化为小样本的、高维的、具有话者整体特征的话者统计特征,可用于话者确认,提高话者确认的性能。 本文还提出了一种基于多阶矩统计量的话者统计特征提取方法,将短时参数变换为多阶矩统计量话者统计特征。短时特征数量众多、所含信息复杂,需要进行加工以提取话者个性信息,矩统计量是统计“加工”的常用方法。每条语音的参数序列在一个与话者无关的统一模板上统计该语音的各阶矩统计量,不仅可以获得权重、均值和方差等低阶矩话者信息,还可以获得三阶矩等较高阶矩话者信息。作为话者统计特征,各种矩含有不同的话者个性信息,能够很好的提取话者个性信息,提高话者确认性能。 由于不同统计特征反映了话者个性特征的不同方面,因此在前面两种话者统计特征的基础上,本论文提出了多种话者统计特征的多SVM话者确认的方法,即用基于概率分布泰勒展开的话者统计特征和基于多阶矩统计量的话者统计特征分别建立SVM话者模型,然后将这两个SVM话者确认子系统输出评分线性融合。在NIST数据库上的实验表明,这种结合能够进一步提高话者确认的性能。与主流的GMM-UBM系统相比,融合后系统的EER相对提高了42.0%(男性)以及28.0%(女性)。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 宁朝;基于SVM技术的英文字符识别方法[J];大众科技;2005年08期
2 王清翔;仲婷;潘金贵;;基于SVM的日文网页分类[J];广西师范大学学报(自然科学版);2007年02期
3 邓河;阳爱民;刘永定;;一种基于SVM的P2P网络流量分类方法[J];计算机工程与应用;2008年14期
4 赵书河,冯学智,都金康,林广发;基于支持向量机的SPIN-2影像与SPOT-4多光谱影像融合研究[J];遥感学报;2003年05期
5 张键;于忠党;栾海滢;;基于SVM的教师评价系统研究[J];教育信息化;2006年03期
6 薄丽玲;;基于SVM的数字图像水印检测算法设计[J];科技情报开发与经济;2007年33期
7 黄秀丽;王蔚;;SVM在非平衡数据集中的应用[J];计算机技术与发展;2009年06期
8 刘晓亮;丁世飞;朱红;张力文;;SVM用于文本分类的适用性[J];计算机工程与科学;2010年06期
9 任俊旭;;基于SVM的企业信息化能力成熟度测度模型研究[J];商业文化(下半月);2011年04期
10 吴春辉;陈洪生;;基于内容的音频分类技术综述[J];现代计算机(专业版);2011年05期
11 毛伟;;基于支持向量机的回归应用研究[J];科技资讯;2011年12期
12 王双亭;艾泽天;都伟冰;康敏;;基于SVM不同核函数的多源遥感影像分类研究[J];河南理工大学学报(自然科学版);2011年03期
13 王亮申,欧宗瑛,苏铁明,杨鑫华,曾好平;利用SVM和灰度基元共生矩阵进行图像数据库检索[J];大连理工大学学报;2003年04期
14 业宁,孙瑞祥,董逸生;MLSVM4——一种多乘子协同优化的SVM快速学习算法[J];计算机研究与发展;2005年09期
15 周珂;彭宏;胡劲松;;支持向量机在心电图分类诊断中的应用[J];微计算机信息;2006年09期
16 游智;李战怀;张阳;;基于字符串核的免分词中文文本分类方法[J];计算机工程与应用;2006年26期
17 朱艳辉;王平;周咏梅;;一种基于Agent的中文Web信息自动检索系统(英文)[J];微电子学与计算机;2006年S1期
18 王明高;王琰;;基于小波提取特征的SVM目标识别[J];沈阳理工大学学报;2006年05期
19 霍东云;聂峰光;郭力;;利用Medline文摘数据库研究文本分类[J];计算机与应用化学;2007年09期
20 刘忠铁;;基于SVM的图像特征样本集构造技术研究[J];科技情报开发与经济;2007年26期
中国重要会议论文全文数据库 前10条
1 ;A Tool Wear Predictive Model Based on SVM[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
2 ;A CDMA Signal Receiver Based on LS-SVM[A];第二十六届中国控制会议论文集[C];2007年
3 司爱威;冯辅周;江鹏程;饶国强;王建;;基于可变风险SVM模型的故障识别方法研究[A];第十届全国振动理论及应用学术会议论文集(2011)上册[C];2011年
4 王红伟;董慧;;一种提高SVM分类精度的调制信号识别方法[A];2010年西南三省一市自动化与仪器仪表学术年会论文集[C];2010年
5 ;Improved Particle Swarm Optimized SVM for Short-term Traffic Flow Predication[A];第二十六届中国控制会议论文集[C];2007年
6 宋鑫颖;周志逵;;一种基于SVM的主动学习文本分类方法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 邵杰;叶宁;容亦夏;;基于SVM的多波束测深数据滤波[A];第二十九届中国控制会议论文集[C];2010年
8 于湘涛;周峰;张兰;魏超;;基于SVM和田口方法的石英挠性加速度计健壮性设计[A];质量——持续发展的源动力:中国质量学术与创新论坛论文集(下)[C];2010年
9 ;Adaptive Control of Nonlinear System Based on SVM Online Algorithm[A];中国自动化学会控制理论专业委员会D卷[C];2011年
10 张睿;陈雪;马建文;;基于递归SVM的高光谱数据特征选择算法研究[A];第八届成像光谱技术与应用研讨会暨交叉学科论坛文集[C];2010年
中国博士学位论文全文数据库 前10条
1 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
2 龙艳花;基于SVM的话者确认关键技术研究[D];中国科学技术大学;2011年
3 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
4 宋国明;基于提升小波及SVM优化的模拟电路智能故障诊断方法研究[D];电子科技大学;2010年
5 张婧;基于SVM的肺结节自动识别方法研究[D];华南理工大学;2011年
6 曹志坤;制冷陈列柜性能仿真SVM方法的研究及应用[D];上海交通大学;2010年
7 王金林;基于混沌时间序列和SVM的入侵检测系统研究[D];天津大学;2010年
8 高二中;对话电话语音的话者确认研究[D];中国科学技术大学;2011年
9 包鑫;稳健回归技术及其在光谱分析中的应用[D];浙江大学;2010年
10 渐令;基于核的学习算法与应用[D];大连理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 严会霞;基于SVM的眼动轨迹解读思维状态的研究[D];太原理工大学;2010年
2 吴迪;基于SVM分类器的分步定位算法研究[D];哈尔滨工业大学;2010年
3 杨焕;基于Basic-N-Units特征的SVM方法预测MicroRNA[D];吉林大学;2010年
4 曾玉祥;盲抽取与SVM方法在地球化学异常下限提取中的应用[D];成都理工大学;2010年
5 曹云生;基于支持向量机(SVM)的森林生态系统健康评价及预警[D];河北农业大学;2011年
6 张汉女;基于SVM的海岸线提取方法研究[D];东北师范大学;2010年
7 姚玉;基于GA-SVM算法的细胞色素酶P450突变预测[D];上海交通大学;2011年
8 陈燃燃;基于SVM算法的web分类研究与实现[D];北京邮电大学;2010年
9 陈卓;基于聚类和SVM主动反馈的图像检索方法[D];重庆大学;2010年
10 刘莹;基于SVM维吾尔文印刷体识别分类器设计[D];新疆大学;2011年
中国重要报纸全文数据库 前10条
1 郭涛;利用SVM虚拟化技术实现容灾[N];中国计算机报;2008年
2 北京首创期货研发中心 张良贵 刘旭;股票分红事件对股指期现套利策略优化实证研究[N];期货日报;2008年
3 杨浩 董轶;上海铝期货市场流动性实证研究[N];期货日报;2004年
4 本报记者 韩露;乱军之中智者胜[N];证券时报;2000年
5 ;基于网络层的存储虚拟化是主流[N];中国计算机报;2008年
6 本报特约记者 陈汤 肖楠;IT用户满意度首次下降[N];计算机世界;2005年
7 本报记者 范卫华;NetValue在中国测量“网上气象”[N];中国经营报;2000年
8 新鹏;东软新品玩转“安全魔方”[N];计算机世界;2006年
9 本报记者 郭平;LSI发布新存储虚拟化管理器[N];计算机世界;2008年
10 徐用懋 熊智华;新技术提升过程测控能力[N];中国化工报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978