收藏本站
收藏 | 论文排版

基于MFCC和GMM的说话人识别系统研究

丁爱明  
【摘要】:说话人识别作为生物认证技术的一种,是根据应用语音波形中反映说话人生理和行为特征语音参数,自动鉴别说话人身份的一种技术。与其它生物识别技术相比,说话人识别具有更为简便,经济及可扩展性良好等众多优势,可广泛应用于电话银行,数据库访问,计算机远程登录,安全验证,控制等领域。正因为说话人识别具有如此广阔的应用前景,国内外许许多多的工作者投身于这一领域的研究中。在众多的说话人识别技术中,本文主要研究了基于Mel频率倒谱系数(Mel-Frequency Cepstrum Coefficients,简称MFCC)和高斯混合模型(Gaussian Mixture Model,简称为GMM)的说话人识别系统。 人的声道响应是反映说话人个性特征的重要的物理量。而语音信号中声道响应是和声门激励信息卷积在一起的。为了从语音信号中得到声道响应就必须对语音信号实现解卷积。本文介绍了对语音信号实现解卷积求取倒谱系数的两种方法:线性预测分析和同态分析处理。通过对语音信号进行解卷,从而获得与声道响应有关的倒谱系数,组成特征向量。 现实生活中人耳是一个比较好的说话人识别系统,而人耳对声音频率的感知却不是线性的。本文通过对人耳听觉的生理和心理特性的分析介绍,提出了利用音调特性来进行倒谱特征提取的方案,即用MEL频率对短时功率谱做频率弯折处理。在这种新的倒谱提取过程中,用符合临界带分布的等效滤波器组来模拟人耳听觉的非线性特性,从而得到了Mel频率倒谱系数(MFCC)。文中详细介绍了提取MFCC倒谱系数的理论基础和实现方案,并与传统的线性预测技术作了比较,实验结果表明这种改进后的倒谱特征提取方法比较有效。 说话人识别中有许多先进有效的识别技术,其中高斯混合模型(GMM)由于性能较好、复杂度小、方法简单,是目前最好的说话人识别算法之一。本文介绍了GMM模型的概念、模型参数的估计以及GMM的识别算法,并通过实验研究分析了GMM模型的阶数对识别性能的影响。 另外,本文还介绍了倒谱系数的动态特征,从MFCC对时间的一阶导数得到了反映倒谱动态特性的ΔMFCC。通过实验验证了动态特征(ΔMFCC)中的确含有有用的说话人个性信息。在原来MFCC倒谱系数的基础上加入ΔMFCC构成更高维的特征向量,并通过实验验证了这种组合特征对提高系统识别性能的有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 房晔;周亚滨;;基于概率神经网络说话人识别的算法研究[J];电子测量技术;2008年08期
2 李泽;崔宣;马雨廷;陈俊宇;;MFCC和LPCC特征参数在说话人识别中的研究[J];河南工程学院学报(自然科学版);2010年02期
3 陈皓,付中华,赵荣椿;基于G.729编码参数的语音特征及其应用[J];西北大学学报(自然科学版);2005年03期
4 王书诏;邱天爽;;与文本无关的说话人识别系统的设计[J];电声技术;2006年12期
5 谢迎春;;小波变换在说话人识别中的应用研究[J];武警工程学院学报;2009年02期
6 檀蕊莲;;小波消噪在说话人识别系统中的应用[J];科技资讯;2010年09期
7 赵立志;李辉;陈海东;魏士勇;;支持向量机在说话人识别系统中的应用[J];China's Foreign Trade;2011年14期
8 李战明;王贞;;矢量量化与神经网络相结合的说话人识别系统[J];计算机工程与应用;2006年15期
9 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期
10 李姮;胡维平;;基于GMM的说话人识别[J];广西物理;2011年01期
11 丁爱明;;作为说话人识别特征参量的M FCC的提取过程[J];电子工程师;2006年01期
12 何朝霞;潘平;;说话人识别中改进的MFCC参数提取方法[J];科学技术与工程;2011年18期
13 岳喜才;叶大田;;文本无关的说话人识别:综述[J];模式识别与人工智能;2001年02期
14 郭春霞;;基于VQ的说话人识别系统实现[J];电脑知识与技术;2009年29期
15 郭春霞;;说话人识别算法的研究[J];西安邮电学院学报;2010年05期
16 陈杰;张玲华;;说话人识别中语音特征参数的研究[J];信息技术;2006年11期
17 张飞云;蔡子亮;盛胜我;;噪声环境下说话人识别性能的研究[J];电声技术;2007年06期
18 王昌龙;周福才;凌裕平;於锋;;基于特征音素的说话人识别方法[J];仪器仪表学报;2007年10期
19 单进;;说话人识别技术研究[J];科技资讯;2010年21期
20 檀蕊莲;;基于VQ的说话人识别技术研究[J];信息技术;2010年08期
中国重要会议论文全文数据库 前10条
1 张彬桥;;基于主分量分析的说话人特征提取[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
2 许鑫;苏开娜;胡起秀;;几种改进的MFCC特征提取方法在说话人识别中的应用[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 张飞云;盛胜我;;混响声场中语音识别的未来与发展研究[A];2005年声频工程学术交流会论文集[C];2005年
4 赵美泽;王峰;;基于消除混响的语音识别技术研究[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
5 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
6 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
7 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
8 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
10 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
2 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
3 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
4 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
5 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
6 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
7 孙真真;基于光学区雷达目标二维像的目标散射特征提取的理论及方法研究[D];中国人民解放军国防科学技术大学;2001年
8 武子玉;矿物近红外光谱信息提取及应用研究[D];吉林大学;2005年
9 王承;基于神经网络的模拟电路故障诊断方法研究[D];电子科技大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 丁爱明;基于MFCC和GMM的说话人识别系统研究[D];河海大学;2006年
2 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
3 陈卫;基于支持向量机的说话人识别系统研究[D];华北电力大学(河北);2005年
4 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
5 王发智;说话人识别方法的研究[D];哈尔滨工程大学;2008年
6 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
7 蒋晔;基于文本无关的说话人识别技术研究[D];南京理工大学;2008年
8 王秀丽;说话人识别系统中特征提取和端点检测算法研究及系统的DSP实现[D];吉林大学;2006年
9 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
10 覃溪;基于文本无关的说话人识别研究[D];广西师范大学;2007年
中国重要报纸全文数据库 前10条
1 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
2 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
3 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
4 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
5 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
6 新城;小声音 大前景[N];计算机世界;2006年
7 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
8 沈占锋;遥感影像信息提取与分析[N];计算机世界;2006年
9 王竣;深入开发CAD系统对疾病诊断有重要意义[N];中国医药报;2007年
10 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978