收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

文本无关说话人识别系统研究

林江云  
【摘要】: 说话人识别技术属于生物认证技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数来自动识别说话人身份的技术。根据说话的内容,可以分为文本相关和无关两个方面。由于文本无关具有更加灵活与适用面广的特点,因此本文选文本无关说话人识别为主要研究课题。在文本无关说话人识别中,GMM将说话人识别问题转换成对说话人语音数据分布的估计问题,从而将复杂的语音训练、匹配的问题分解为模型参数的训练,以及概率的计算等子问题,解决了说话人识别任务中的很多难题。并且由于GMM具有简单、灵活、有效的特点以及较好的鲁棒性,迅速成为与文本无关的说话人识别中的主流技术。 在系统构建方面,本文利用VC++实现了一个完整的说话人识别系统,包括前期的语音处理,特征提取以及后期的模型训练,识别。实现了说话人识别的两大功能:说话人辨认和说话人确认。在前期语音处理和特征提取方面,使用了Mel倒谱系数(MFCC)作为特征参数,在说话人模型方法,采用了高斯混合模型,它使用不同高斯密度的叠加来反映语音的声纹特征。本文的工作主要有以下几个方面: 1.研究了GMM性能与训练数据集和测试数据集的依赖关系,特别是GMM阶数与训练数据集的关系。验证了在一定的训练集下,GMM阶数达到一定时,模型性能就会达到最优,继续增加GMM阶数将会导致模型性能下降。 2.分析比较高斯混模型的训练方法包括:区别性训练方法和传统最大似然估计方法,并通过实验验证了区别性训练方法能够有效地提高说话人识别性能。 3.本文提出一种新的方法,通过聚类优化GMM,有效地减少GMM高斯分量的数目。通过实验验证该算法能够在不明显降低系统识别率的情况下,有效地提高说话人识别的速度。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵立志;李辉;陈海东;王全发;;基于LabVIEW的说话人识别虚似仪器开发[J];China's Foreign Trade;2011年14期
2 王雪峰;陈兴稣;樊小超;;基于GMM的EM分割算法在图像检索中的应用[J];新疆师范大学学报(自然科学版);2011年02期
3 赵立志;李辉;陈海东;魏士勇;;支持向量机在说话人识别系统中的应用[J];China's Foreign Trade;2011年14期
4 何朝霞;潘平;;说话人识别中改进的MFCC参数提取方法[J];科学技术与工程;2011年18期
5 宁向延;景昊;;二次判决的融合系统在说话人识别中的应用[J];武汉大学学报(工学版);2011年04期
6 姚红;谭敏;郭武;;音素层特征超矢量的说话人识别性能及优化[J];计算机工程与应用;2011年26期
7 刘晋胜;;采用熵相关性优化分离性的SVM说话人识别[J];计算机工程与设计;2011年08期
8 何亮;刘加;;基于线性对数似然核函数的说话人识别[J];计算机应用;2011年08期
9 何亮;史永哲;刘加;;联合因子分析中的本征信道空间拼接方法[J];自动化学报;2011年07期
10 郑泽萍;王万良;郑建炜;;基于保局部核RVM的说话人识别方法[J];计算机工程;2011年14期
11 何亮;栗志意;蔡猛;刘加;;集合分类中的鉴别式局部信息距离保持映射[J];清华大学学报(自然科学版);2011年07期
12 杨雅婷;董兴华;王磊;吐尔洪·吾司曼;李晓;;电话信道维吾尔语口语语料库设计与研究[J];计算机工程与应用;2011年23期
13 张汀;;语音识别在监狱安防管理中的应用[J];电脑知识与技术;2011年23期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
2 侯丽敏;谢娟敏;;共振峰瞬时频率特征用于说话人识别[A];第九届中国语音学学术会议论文集[C];2010年
3 高争艳;王慕坤;;基于核K-均值聚类和支持向量机结合的说话人识别方法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
4 田岚;侯正信;陆小珊;;基于多元信息和GMM的序贯判决话者识别[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
5 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
6 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
7 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
8 周静芳;陈一宁;刘润生;;一种新的说话人识别信道补偿技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
9 吴志强;陈珂;迟惠生;;语音识别技术与说话人识别技术的结合——文本无关说话人识别的另一种方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年
10 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
3 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年
4 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
5 张卫东;广义矩方法GMM的理论本质及方法延伸研究[D];西南财经大学;2010年
6 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年
7 黄砚玲;地理加权空间经济计量模型的GMM估计及区域金融发展收敛性实证研究[D];华南理工大学;2012年
8 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
9 孙俊;基于激励源及其韵律特征的源—目标说话人声音转换研究[D];中国科学技术大学;2006年
10 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
中国硕士学位论文全文数据库 前10条
1 陈强;基于GMM的说话人识别系统研究与实现[D];武汉理工大学;2010年
2 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
3 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
4 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年
5 朱建伟;说话人识别中特征参数的提取及优化研究[D];三峡大学;2010年
6 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
7 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
8 罗晓亭;多路并行实时说话人识别算法研究与实现[D];解放军信息工程大学;2010年
9 潘鹏;会议室环境下基于音频视频信息融合的多说话人识别[D];兰州理工大学;2011年
10 林江云;文本无关说话人识别系统研究[D];厦门大学;2008年
中国重要报纸全文数据库 前10条
1 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
2 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
3 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
4 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
5 新城;小声音 大前景[N];计算机世界;2006年
6 本报记者 王璐;科大讯飞:挖掘“说话”技术的商机[N];上海证券报;2008年
7 吴为;西安市政府为软件业出台“硬九条”[N];中国机电日报;2001年
8 钟启;三诺公司启动音乐装饰工程[N];中国企业报;2000年
9 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
10 陈泰 记者 吴长锋;安徽隆起创新人才高地[N];科技日报;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978