收藏本站
《中国科学技术大学》 2011年 博士论文
收藏 | 手机打开
二维码
手机客户端打开本文

基于话者统计特征和SVM的文本无关话者确认研究

许敏强  
【摘要】:随着信息化地不断深入,话者确认等身份识别方法越来越受到人们的重视。话者确认,尤其是用户界面友好的与文本无关的话者确认,以其广阔的市场前景,吸引了越来越多的研究人员的重视,成为目前研究的重点。 话者确认是一个分类问题。支持向量机(Support Vector Machine,SVM)是一种分类能力很强的分类器,目前在模式分类中运用广泛。但是,SVM是一种针对小样本的机器学习算法,在处理需要较长语音的文本无关话者确认时,面临着短时特征矢量样本数量大、数据混叠严重、目标话者和冒人话者样本数量不平衡等问题。此外,SVM只考虑分类面上的支持向量,而单一帧短时特征缺少话者整体信息,因此基于短时特征的SVM话者确认还面临着单一帧缺乏话者特征信息的问题。这些问题制约了SVM用于话者确认,影响了基于SVM的话者确认的性能。 针对SVM用于文本无关话者确认存在的问题,本文提出了基于统计信息的话者特征提取方法,将大样本的、混叠严重的、单一帧缺乏话者整体信息的短时特征转化为小样本的、高维的、具有话者整体信息、适合SVM建模的统计话者特征,运用于SVM话者建模,提高了与文本无关的话者确认的性能。 本文提出了一种基于概率分布泰勒展开的话者统计特征提取方法,采用各阶泰勒展开项的微商部分作为话者统计特征。泰勒公式(Taylor’s theorem)表明可以用函数某点的各阶导数值重构该点邻域内的该函数。在话者确认问题上,对于两个语音观测序列,通过比较两个话者特征概率分布函数在同一点处的各阶泰勒展开项的微商值,可以确定这两个GMM是否相同,从而判定这两个语音观测序列是否属于同一个人。用GMM拟合话者短时倒谱参数的概率分布,然后对GMM进行泰勒展开,求取GMM的各阶泰勒展开项的微商值作为话者统计特征。此话者统计特征代表了话者特征概率分布函数的特性。此方法能够将短时特征转化为小样本的、高维的、具有话者整体特征的话者统计特征,可用于话者确认,提高话者确认的性能。 本文还提出了一种基于多阶矩统计量的话者统计特征提取方法,将短时参数变换为多阶矩统计量话者统计特征。短时特征数量众多、所含信息复杂,需要进行加工以提取话者个性信息,矩统计量是统计“加工”的常用方法。每条语音的参数序列在一个与话者无关的统一模板上统计该语音的各阶矩统计量,不仅可以获得权重、均值和方差等低阶矩话者信息,还可以获得三阶矩等较高阶矩话者信息。作为话者统计特征,各种矩含有不同的话者个性信息,能够很好的提取话者个性信息,提高话者确认性能。 由于不同统计特征反映了话者个性特征的不同方面,因此在前面两种话者统计特征的基础上,本论文提出了多种话者统计特征的多SVM话者确认的方法,即用基于概率分布泰勒展开的话者统计特征和基于多阶矩统计量的话者统计特征分别建立SVM话者模型,然后将这两个SVM话者确认子系统输出评分线性融合。在NIST数据库上的实验表明,这种结合能够进一步提高话者确认的性能。与主流的GMM-UBM系统相比,融合后系统的EER相对提高了42.0%(男性)以及28.0%(女性)。


知网文化
【相似文献】
中国期刊全文数据库 前3条
1 盛涛;张浩;崔学荣;刘兴;;一种基于统计参数的IR-UWB系统TOA估计方法[J];中国科技信息;2013年09期
2 邹明达;用时空平均法降低噪声统计参数测量误差[J];声学与电子工程;1987年04期
3 吴冬峰;王志明;;关于集成电路网络统计特性分析及其应用初探[J];黑龙江科技信息;2010年19期
中国重要会议论文全文数据库 前1条
1 陈干琴;刘炳忠;宋秀英;刘群;;山东省点暴雨量多年统计特征分析[A];中国水利学会2010学术年会论文集(上册)[C];2010年
中国博士学位论文全文数据库 前1条
1 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前1条
1 王新东;IPv6网络状况分析与地址统计[D];吉林大学;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978