收藏本站
《国防科学技术大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于矢量量化的说话人识别研究

蒋皓石  
【摘要】: 说话人识别技术作为语音信号处理的一个重要组成部分,其巨大的应用前景和广阔的未知领域正受到越来越多人的重视。说话人识别是通过对说话人语音信号的分析和特征提取,自动地确定说话人是否在所登记的说话人集合中,以及说话人是谁的过程。通常,根据训练和测试说话人语音内容的不同,说话人识别可以分为与文本有关和与文本无关的说话人识别。论文主要是基于矢量量化的与文本无关说话人识别技术的研究。 在说话人识别方面,由于矢量量化技术可以有效地提取说话人的个性特征,矢量量化码本可以在最佳意义上代表说话人特征矢量空间中的所有矢量,因而矢量量化码本可作为说话人有效的识别模型,而模型建立的关键问题是获得高质量的码本。LBG算法是目前矢量码本聚类的经典算法,但该算法对初始码书的依赖性较大,容易陷入局部最优,论文在基于矢量量化的与文本无关说话人识别试验中研究了RLS聚类算法。试验表明,RLS算法在语音参数聚类中表现出了很好的性能,得到的码书质量优于经典的LBG算法,从而为设计全局准最优码书提供了一种新思路。 我们在进行说话人识别试验时分别建立了20个男说话人和10个女说话人用于训练和测试时的语音数据库。在录制不同说话人的语音库时,充分考虑到了语速快慢、音量、时间、噪音等影响说话人识别性能的因素。 在RLS算法基础上建立了一套基于矢量量化的与文本无关的说话人识别系统,进而分别研究了码本容量大小和说话人语音时长与其识别效果的关系,试验结果表明,考虑到各方面综合因素时,矢量量化中码本容量选为50-80之间较合适些,在进行说话人测试时,其语音时长取为5~8秒较合理些。 此外,我们在说话人识别试验中对常见的语音特征参数进行了研究,主要研究了线性预测倒谱(LPCC)、美尔倒谱(MFCC)等参数,并且分别基于计算机平台试验比较了LPCC和MFCC参数的识别效果。针对单独使用LPCC或MFCC应用于说话人识别中存在识别率还不够高的问题,分析了原因,然后又对长时频谱特征进行了研究,并把长时频谱特征分别与LPCC和MFCC结合起来共同应用于说话人识别试验,从而在一定程度上减少了单独使用LPCC或MFCC运用于说话人识别中存在的问题,提高了系统的识别性能,取得了较好的效果。
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TN912.34

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 宁飞,陈频;说话人识别的几种方法[J];电声技术;2001年12期
2 黄南华,吴亚栋,李治柱;基于特征空间轨迹多模板匹配的说话人识别研究[J];计算机工程;2001年05期
3 潘洁;基于序贯判决法的自动说话人识别[J];微机发展;2000年01期
【共引文献】
中国期刊全文数据库 前10条
1 张道信,周爱毓;语音信号实时降噪软件的设计[J];安徽大学学报(自然科学版);2004年04期
2 施俊强,池明敏;基于TMS320C54x DSKplus的实时TCM语音编解码算法的实现[J];半导体技术;2001年08期
3 邓勇,施文康;基于TMS320C50的语音频谱分析仪[J];兵工自动化;2000年03期
4 黄新宇,吴淑珍;基于单边自相关线性预测噪声中汉语语音识别[J];北京大学学报(自然科学版);2000年05期
5 刘敬伟,程乾生;基于动态时间规划的基因芯片数据识别[J];北京大学学报(自然科学版);2002年05期
6 段新,黄新宇,吴淑珍;与文本无关的说话人辨认系统中一种新的使用基音周期方法研究[J];北京大学学报(自然科学版);2003年05期
7 王炜,刘峰,吴淑珍;RASTA滤波在语音通信质量客观评价中应用的研究[J];北京大学学报(自然科学版);2003年05期
8 何强,毛士艺,张有为;汉语语音识别的平滑声韵基元HMM算法[J];北京航空航天大学学报;2001年02期
9 王洪,彭熙伟,李占宏,侯增广;基于FFT的车轮动平衡检测技术[J];北京理工大学学报;2002年03期
10 刘万春,罗双华,朱玉文,谢世斌;基于聚类分析和支持向量机的布匹瑕疵分类方法[J];北京理工大学学报;2004年08期
中国重要会议论文全文数据库 前10条
1 郭锋;刘丽丽;吕凝;;基于LLE和SVM的人像识别方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
2 王伟;郑东良;;支持向量机的分类机理研究[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
3 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
4 Dougsoo Kaown;刘建国;;支持向量机的几何解法(英文)[A];中国运筹学会第八届学术交流会论文集[C];2006年
5 乔立岩;彭喜元;彭宇;;基于支持向量机的键盘密码输入异常检测方法研究[A];2004全国测控、计量与仪器仪表学术年会论文集(上册)[C];2004年
6 荣海娜;张葛祥;张翠芳;;基于支持向量机的非线性系统辨识方法[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
7 王薇;李晓辉;;CDMA系统中基于SVM的多用户检测算法[A];第十九届电工理论学术年会论文集[C];2007年
8 刘明贵;彭俊伟;;进化支持向量机在基桩低应变完整性检测中的应用[A];2007'湖北·武汉NDT学术年会论文集[C];2007年
9 徐沧;鲍玉昆;张金隆;丛国栋;;基于SVM的项目评标决策模型[A];第10届计算机模拟与信息技术会议论文集[C];2005年
10 何新;赵亚琴;周献中;;基于多层次支持向量机分类树的音频分类方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 陈莉;KDD中的几个关键问题研究[D];西安电子科技大学;2003年
2 刘大健;模糊模式识别在模拟驾驶系统中的应用研究[D];浙江大学;2005年
3 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
4 付强;语音的参数表示和质量客观评价研究[D];西安电子科技大学;2000年
5 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年
6 钟金宏;基于音节的汉语连续语音声调识别方法研究[D];合肥工业大学;2001年
7 赵瑞珍;小波理论及其在图像、信号处理中的算法研究[D];西安电子科技大学;2001年
8 戚永军;光纤共焦扫描显微成像技术的研究[D];南京理工大学;2002年
9 叶俊勇;人脸检测与识别方法研究[D];重庆大学;2002年
10 马笑潇;智能故障诊断中的机器学习新理论及其应用研究[D];重庆大学;2002年
中国硕士学位论文全文数据库 前10条
1 林红华;电子商务环境下企业信息的智能统计分析方法研究[D];重庆大学;2004年
2 李新军;基于支持向量机的建模预测研究[D];天津大学;2004年
3 余浩;说话人识别的自适应算法研究[D];武汉理工大学;2005年
4 张晓旻;基于语音识别的音频多媒体会议记录系统的研究[D];河北工业大学;2000年
5 刘兴立;任意文本的说话人识别系统研究[D];大连理工大学;2000年
6 王佳庆;通用机器人单片机控制器[D];苏州大学;2001年
7 屈炳云;移动通信中的多用户检测算法[D];西安电子科技大学;2001年
8 周德俊;基于CELP的低速率语音编解码器及其AMR技术研究[D];电子科技大学;2001年
9 黎照明;软件无线电中几项DSP实现技术的研究[D];电子科技大学;2001年
10 陈文;AMR声码器自适应码本搜索技术及其DSP实现[D];电子科技大学;2001年
【同被引文献】
中国期刊全文数据库 前10条
1 赵力,邹采荣,吴镇扬;基于分段模糊聚类算法的VQ-HMM语音识别模型参数估计[J];电路与系统学报;2002年03期
2 丁爱明;;作为说话人识别特征参量的M FCC的提取过程[J];电子工程师;2006年01期
3 邓菁,郑永果;基于形态学的图像二值化方法[J];计算机工程;2002年11期
4 郭景峰,申光宪,郑绳楦,蔺旭东;数学形态学在数字滤波中的应用研究[J];机械工程学报;2002年10期
5 苗燕;高翔;;语音模仿材料的分类及分级研究[J];外语电化教学;2007年01期
6 蒋刚毅,郑义;基于数学形态滤波的语音信号基音特征提取[J];声学学报(中文版);1998年06期
7 陈平,李庆民;基于数学形态学的数字滤波器设计与分析[J];中国电机工程学报;2005年11期
8 但志平,王以治,黄艳,李保华;基于LPC倒谱参数和支持向量机技术的说话人识别系统[J];电声技术;2004年03期
9 李战明,王贞;基于小波包分析特征参数的说话人识别系统[J];电声技术;2005年06期
10 林琳;王树勋;;基于自适应小生境混合遗传算法的说话人识别[J];电子学报;2007年01期
中国博士学位论文全文数据库 前1条
1 任获荣;数学形态学及其应用[D];西安电子科技大学;2004年
中国硕士学位论文全文数据库 前10条
1 胡英;数学形态学及其在地震信号处理中的应用[D];成都理工大学;2005年
2 崔国辉;说话人识别方法与策略的研究[D];山东大学;2005年
3 覃溪;基于文本无关的说话人识别研究[D];广西师范大学;2007年
4 周昆湘;基于矢量量化的与文本无关的说话人确认系统的研究[D];中南大学;2007年
5 郭晓玲;基于矢量量化的说话人识别[D];东北电力大学;2008年
6 王金甲;噪声环境下鲁棒性文本自由说话人辨认系统的研究[D];燕山大学;2003年
7 郭春霞;基于MFCC的说话人识别系统研究[D];西安电子科技大学;2006年
8 常志国;说话人识别系统的研究与实现[D];上海师范大学;2004年
9 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
10 张荣强;说话人识别中特征提取的方法研究[D];大连理工大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 房晔;周亚滨;;基于概率神经网络说话人识别的算法研究[J];电子测量技术;2008年08期
2 李泽;崔宣;马雨廷;陈俊宇;;MFCC和LPCC特征参数在说话人识别中的研究[J];河南工程学院学报(自然科学版);2010年02期
3 陈皓,付中华,赵荣椿;基于G.729编码参数的语音特征及其应用[J];西北大学学报(自然科学版);2005年03期
4 王书诏;邱天爽;;与文本无关的说话人识别系统的设计[J];电声技术;2006年12期
5 谢迎春;;小波变换在说话人识别中的应用研究[J];武警工程学院学报;2009年02期
6 檀蕊莲;;小波消噪在说话人识别系统中的应用[J];科技资讯;2010年09期
7 赵立志;李辉;陈海东;魏士勇;;支持向量机在说话人识别系统中的应用[J];China's Foreign Trade;2011年14期
8 李战明;王贞;;矢量量化与神经网络相结合的说话人识别系统[J];计算机工程与应用;2006年15期
9 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期
10 李姮;胡维平;;基于GMM的说话人识别[J];广西物理;2011年01期
中国重要会议论文全文数据库 前10条
1 张彬桥;;基于主分量分析的说话人特征提取[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
2 许鑫;苏开娜;胡起秀;;几种改进的MFCC特征提取方法在说话人识别中的应用[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 张飞云;盛胜我;;混响声场中语音识别的未来与发展研究[A];2005年声频工程学术交流会论文集[C];2005年
4 赵美泽;王峰;;基于消除混响的语音识别技术研究[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
5 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
6 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
7 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
8 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
10 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
中国重要报纸全文数据库 前10条
1 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
2 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
3 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
4 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
5 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
6 新城;小声音 大前景[N];计算机世界;2006年
7 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
8 沈占锋;遥感影像信息提取与分析[N];计算机世界;2006年
9 王竣;深入开发CAD系统对疾病诊断有重要意义[N];中国医药报;2007年
10 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
中国博士学位论文全文数据库 前10条
1 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
2 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
3 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
4 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
5 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
6 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
7 孙真真;基于光学区雷达目标二维像的目标散射特征提取的理论及方法研究[D];中国人民解放军国防科学技术大学;2001年
8 武子玉;矿物近红外光谱信息提取及应用研究[D];吉林大学;2005年
9 王承;基于神经网络的模拟电路故障诊断方法研究[D];电子科技大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
2 陈卫;基于支持向量机的说话人识别系统研究[D];华北电力大学(河北);2005年
3 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
4 王发智;说话人识别方法的研究[D];哈尔滨工程大学;2008年
5 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
6 蒋晔;基于文本无关的说话人识别技术研究[D];南京理工大学;2008年
7 王秀丽;说话人识别系统中特征提取和端点检测算法研究及系统的DSP实现[D];吉林大学;2006年
8 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
9 覃溪;基于文本无关的说话人识别研究[D];广西师范大学;2007年
10 许艳红;HHT变换在说话人识别中的应用[D];浙江大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026