收藏本站
《中国科学技术大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于话者统计特征和SVM的文本无关话者确认研究

许敏强  
【摘要】:随着信息化地不断深入,话者确认等身份识别方法越来越受到人们的重视。话者确认,尤其是用户界面友好的与文本无关的话者确认,以其广阔的市场前景,吸引了越来越多的研究人员的重视,成为目前研究的重点。 话者确认是一个分类问题。支持向量机(Support Vector Machine,SVM)是一种分类能力很强的分类器,目前在模式分类中运用广泛。但是,SVM是一种针对小样本的机器学习算法,在处理需要较长语音的文本无关话者确认时,面临着短时特征矢量样本数量大、数据混叠严重、目标话者和冒人话者样本数量不平衡等问题。此外,SVM只考虑分类面上的支持向量,而单一帧短时特征缺少话者整体信息,因此基于短时特征的SVM话者确认还面临着单一帧缺乏话者特征信息的问题。这些问题制约了SVM用于话者确认,影响了基于SVM的话者确认的性能。 针对SVM用于文本无关话者确认存在的问题,本文提出了基于统计信息的话者特征提取方法,将大样本的、混叠严重的、单一帧缺乏话者整体信息的短时特征转化为小样本的、高维的、具有话者整体信息、适合SVM建模的统计话者特征,运用于SVM话者建模,提高了与文本无关的话者确认的性能。 本文提出了一种基于概率分布泰勒展开的话者统计特征提取方法,采用各阶泰勒展开项的微商部分作为话者统计特征。泰勒公式(Taylor’s theorem)表明可以用函数某点的各阶导数值重构该点邻域内的该函数。在话者确认问题上,对于两个语音观测序列,通过比较两个话者特征概率分布函数在同一点处的各阶泰勒展开项的微商值,可以确定这两个GMM是否相同,从而判定这两个语音观测序列是否属于同一个人。用GMM拟合话者短时倒谱参数的概率分布,然后对GMM进行泰勒展开,求取GMM的各阶泰勒展开项的微商值作为话者统计特征。此话者统计特征代表了话者特征概率分布函数的特性。此方法能够将短时特征转化为小样本的、高维的、具有话者整体特征的话者统计特征,可用于话者确认,提高话者确认的性能。 本文还提出了一种基于多阶矩统计量的话者统计特征提取方法,将短时参数变换为多阶矩统计量话者统计特征。短时特征数量众多、所含信息复杂,需要进行加工以提取话者个性信息,矩统计量是统计“加工”的常用方法。每条语音的参数序列在一个与话者无关的统一模板上统计该语音的各阶矩统计量,不仅可以获得权重、均值和方差等低阶矩话者信息,还可以获得三阶矩等较高阶矩话者信息。作为话者统计特征,各种矩含有不同的话者个性信息,能够很好的提取话者个性信息,提高话者确认性能。 由于不同统计特征反映了话者个性特征的不同方面,因此在前面两种话者统计特征的基础上,本论文提出了多种话者统计特征的多SVM话者确认的方法,即用基于概率分布泰勒展开的话者统计特征和基于多阶矩统计量的话者统计特征分别建立SVM话者模型,然后将这两个SVM话者确认子系统输出评分线性融合。在NIST数据库上的实验表明,这种结合能够进一步提高话者确认的性能。与主流的GMM-UBM系统相比,融合后系统的EER相对提高了42.0%(男性)以及28.0%(女性)。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP18;TN912.34

【参考文献】
中国期刊全文数据库 前1条
1 姚志强;吴礼福;戴蓓蒨;周曦;;用于文本无关的话者识别的超音段信息提取[J];数据采集与处理;2005年04期
中国博士学位论文全文数据库 前2条
1 刘明辉;基于GMM和SVM的文本无关的说话人确认方法研究[D];中国科学技术大学;2007年
2 许东星;基于GMM和高层信息特征的文本无关说话人识别研究[D];中国科学技术大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 李淑华;徐良培;陶建平;;基于支持向量机的我国水产品出口贸易风险预警研究[J];安徽农业科学;2008年30期
2 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
3 程伟;张燕平;赵姝;;支持向量机在粮食产量预测中的应用[J];安徽农业科学;2009年08期
4 赵万明;黄彦全;谌贵辉;;基于支持向量机的农村用电量需求预测[J];安徽农业科学;2009年25期
5 管翠萍;;药物靶标G蛋白偶联受体的识别预测[J];安徽农业科学;2010年24期
6 刘婷婷;;基于支持向量机的水稻纹枯病识别研究[J];安徽农业科学;2011年28期
7 陈蕴谷;;基于谱减法和经验模式分解的语音增强[J];安庆师范学院学报(自然科学版);2010年01期
8 高闯;王立东;周世宇;;基于支持矢量机的宫颈细胞分类[J];辽宁科技大学学报;2009年03期
9 施俊强,池明敏;基于TMS320C54x DSKplus的实时TCM语音编解码算法的实现[J];半导体技术;2001年08期
10 邹心遥;姚若河;;基于LSSVM的小子样元器件寿命预测[J];半导体技术;2011年09期
中国重要会议论文全文数据库 前10条
1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
2 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
3 周绮凤;林成德;罗林开;彭洪;;一种基于黎曼度量的训练样本类不平衡SVM分类方法研究[A];第二十六届中国控制会议论文集[C];2007年
4 顾小军;杨世锡;钱苏翔;;基于支持向量机的旋转机械多类故障识别研究[A];第二十六届中国控制会议论文集[C];2007年
5 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
6 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
7 蒋少华;桂卫华;阳春华;唐朝晖;蒋朝辉;;基于主元分析与支持向量机的方法及其在密闭鼓风炉过程监控诊断中的应用[A];第二十七届中国控制会议论文集[C];2008年
8 康传会;汪晓东;汪轲;常健丽;;基于最小二乘支持向量机的迟滞建模方法[A];第二十九届中国控制会议论文集[C];2010年
9 王海丰;李壮;任洪娥;赵鹏;;基于非下采样Contourlet变换和SVM的纹理图像分割算法[A];第二十九届中国控制会议论文集[C];2010年
10 ;Image Classification with Ant Colony Based Support Vector Machine[A];中国自动化学会控制理论专业委员会A卷[C];2011年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
3 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
4 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
5 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
6 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
7 李晚龙;六自由度Stewart平台分散智能控制研究[D];哈尔滨工程大学;2010年
8 杨宁;计算机辅助卷烟配方设计关键技术研究[D];中国海洋大学;2010年
9 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
10 柏坚;非线性数学地质模型研究及在滇东南金矿成矿预测中的应用[D];中国地质大学(北京);2010年
中国硕士学位论文全文数据库 前10条
1 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
2 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
3 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
4 王萍;语音情感识别研究[D];山东科技大学;2010年
5 徐芳芳;优化问题的PVD算法研究[D];山东科技大学;2010年
6 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
7 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
8 姜成玉;基于支持向量机的时间序列预测[D];辽宁师范大学;2010年
9 李海清;支持向量机在金融市场预测中的应用[D];辽宁师范大学;2010年
10 江达秀;基于HMAX模型的人脸表情识别研究[D];浙江理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前8条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 李霄寒,戴蓓倩,方绍武,刘鸣;基于子带HMM和MLP的话者确认系统的噪声鲁棒性研究[J];电路与系统学报;2002年02期
3 黄伟,戴蓓蒨;基于GMM统计特性参数和SVM的话者确认[J];数据采集与处理;2004年04期
4 刘明辉,陈继旭,戴蓓蒨,李辉;基于TZ Normalization规整的话者确认阈值选取[J];数据采集与处理;2005年03期
5 姚志强;吴礼福;戴蓓蒨;周曦;;用于文本无关的话者识别的超音段信息提取[J];数据采集与处理;2005年04期
6 李霄寒,戴蓓倩,方绍武,刘鸣;高阶MFCC的话者识别性能及其噪声鲁棒性[J];信号处理;2001年02期
7 陈继旭;刘明辉;戴蓓蒨;李辉;;文本无关说话人确认中的一种新的评分规整方法[J];信号处理;2006年04期
8 吴礼福;姚志强;戴蓓蒨;李辉;;音源特征用于提高话者确认系统的鲁棒性[J];中国科学技术大学学报;2006年05期
中国博士学位论文全文数据库 前1条
1 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
【相似文献】
中国期刊全文数据库 前3条
1 盛涛;张浩;崔学荣;刘兴;;一种基于统计参数的IR-UWB系统TOA估计方法[J];中国科技信息;2013年09期
2 邹明达;用时空平均法降低噪声统计参数测量误差[J];声学与电子工程;1987年04期
3 吴冬峰;王志明;;关于集成电路网络统计特性分析及其应用初探[J];黑龙江科技信息;2010年19期
中国重要会议论文全文数据库 前1条
1 陈干琴;刘炳忠;宋秀英;刘群;;山东省点暴雨量多年统计特征分析[A];中国水利学会2010学术年会论文集(上册)[C];2010年
中国博士学位论文全文数据库 前1条
1 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前1条
1 王新东;IPv6网络状况分析与地址统计[D];吉林大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026