收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于神经网络的声纹识别系统设计与实现

郭华  
【摘要】: 声纹识别又称说话人识别(Speaker Recognition, SR),是近年来兴起的一种生物识别技术,声纹识别以其独特的方便性、经济性和准确性等优势受到世人瞩目。近年来,随着科学技术的发展,声纹识别技术已经得到了极大的发展,它在公安侦察、声控系统、医疗诊断、电子金融等行业和领域有着极其广阔的市场应用前景。声纹识别根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份。与语音识别不同,声纹识别技术并不注意语音信号中的语义内容,而是希望从语音信号中提取出个人的信息特征。声纹识别有几个关键技术:首先是特征选取的问题,从声学或者统计学的角度从声音信号中提取某些特征参数,用这些特征参数来描述说话人的声音特征。其次是识别模型,用机器学习模型去学习、记忆说话人特征,从而达到识别的目的。 本文系统阐述了声纹识别技术的原理与一般流程,并重点研究了: 1、声纹识别系统的语音特征参数提取。详细阐述了声道模型、线性预测编码(LPC)分析、LPC倒谱系数、Mel倒谱系数的求解; 2、声纹识别的识别方法和模型。重点阐述了几种经典的主要声纹识别模型,包括隐马尔可夫模型(HMM)、高斯混合模型(GMM)、矢量量化模型(VQ)、人工神经网络及支持向量机(SVM)等。 基于基本声纹识别理论和技术的研究,本文基于线性倒谱系数(LPCC)和Mel倒谱系数(MFCC)两种主要语音特征参数,采用人工神经网络作为识别模型,研究设计了一个声纹识别的原型系统。MFCC是目前使用最广泛的语音特征之一,具有计算简单、区分能力好等突出的优点;LPCC参数则具有计算高效的优点,并且比较彻底地去掉了语音产生过程中的激励信息,主要反映了声道响应,往往只要十几个倒谱系数就能较好地描述语音信号的共振峰特性,在声纹识别中取得了较好的效果,因而本文将LPCC和MFCC参数作为研究和选取的主要特征参数。神经网络的参数优化是神经网络技术研究与应用的关键,目前一般的研究大多采用遗传算法(GA)或者BP算法等进行网络参数的优化,本文将粒子群优化算法(PSO)应用于声纹识别神经网络。PSO是一种群智能技术,与GA相比,PSO算法具有编码简单,算法高效并易于实现、理解等优点。 在声纹识别原型系统实现的基础上,本文在实验室环境下利用该系统进行了大量的声纹识别实验,对系统进行了系统的识别测试。这些实验以不同的方法采集实验语料,包括与文本相关的语料,与文本无关的语料,以及短时语料、较长时间语料等,文章还对不同方法方式采集的语音做的实验进行了对比分析。实验结果表明,PSO和ANN结合模型在声纹识别上具有很好的识别效果,是比较有效的识别方法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 牛丽莎;贾晓东;沈西挺;;遗传算法和BP网络相结合的分类器在BCI中的应用[J];微计算机信息;2010年33期
2 郭丽华,王大成,丁士圻;水下目标特征提取方法研究[J];声学技术;2005年03期
3 孙宁;孙劲光;孙宇;;基于神经网络的语音识别技术研究[J];计算机与数字工程;2006年03期
4 杨晓波;;基于人工神经网络的织物疵点聚类分析[J];纺织学报;2011年09期
5 路志英;杨乐;赵智超;杨玉峰;;沙尘暴综合预报系统中场特征提取方法的研究[J];计算机仿真;2007年06期
6 朱海涛;;基于神经网络的语音识别鲁棒性研究[J];中国科技信息;2008年05期
7 许颖泉;;用神经网络进行数字图象识别研究[J];科技风;2008年24期
8 盖杉;刘鹏;唐降龙;;美元清分机识别系统设计与实现[J];计算机工程与应用;2009年23期
9 谢晓阳;刘建敏;乔新勇;;基于神经网络的柴油机技术状态主元信息提取方法[J];装甲兵工程学院学报;2010年06期
10 钟珞;宋华珠;;基于PCA与ICA的结构损伤识别[J];武汉理工大学学报;2006年07期
11 颜培玉;张国栋;;基于人工神经网络的手写体数字识别方法[J];沈阳航空工业学院学报;2008年02期
12 魏冬冬;谌海新;聂铁铸;;人脸特征提取与识别技术研究[J];计算机与现代化;2007年03期
13 李鹏;刘民;吴澄;;一种基于特征提取方法的智能预测算法[J];控制与决策;2007年12期
14 达吾勒·阿布都哈依尔;古丽拉·阿东别克;;基于ANN的哈萨克文手写文字识别系统的研究[J];计算机工程与应用;2008年01期
15 郭凌云;杨长兴;;基于小波变换的乳腺肿瘤B超图像识别的研究[J];计算技术与自动化;2010年01期
16 高守国,屈凌波,相秉仁,安登魁;人工神经网络用于特征提取及其在牛黄鉴别中的应用[J];计算机与应用化学;2000年Z1期
17 王建雄;刘应龙;;基于人工神经网络的数字识别系统的研究[J];计算机技术与发展;2006年05期
18 李莉;;人脸识别技术研究[J];大众科技;2006年08期
19 胡恒滔;龙建忠;;基于蚁群算法的模糊C-均值聚类算法在声纹识别中的应用[J];四川大学学报(自然科学版);2007年03期
20 周祥,李正明,孙俊;轮胎胎号字符识别系统[J];计测技术;2005年04期
中国重要会议论文全文数据库 前10条
1 王声兴;;偏最小二乘法+神经网络用于膀胱癌组织自体荧光的模式识别[A];第十五届全国泌尿外科学术会议论文集[C];2008年
2 冯玉强;黄梯云;;基于人工神经网络的人口发展模型的自动选择[A];管理科学与系统科学进展——全国青年管理科学与系统科学论文集(第3卷)[C];1995年
3 邱天爽;初孟;;基于人工神经网络的癫痫棘波检测方法[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
4 赵卿;曹晓岚;;人工神经网络及其在医学中的应用[A];第五次全国中西医结合神经科学术会议论文集[C];2004年
5 张云佳;晏华;;支持向量机在肝病分类模型中的应用[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
6 田国富;张国忠;张幼君;;人工神经网络在齿轮设计中的应用[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(下)[C];2003年
7 汪学清;单仁亮;;人工神经网络在爆破块度预测中的应用研究[A];第二届中国水利水电岩土力学与工程学术讨论会论文集(一)[C];2008年
8 应义斌;景寒松;赵匀;;人工神经网络在黄花梨果形识别中的应用[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
9 周保生;朱维申;;巷道围岩移近量的人工神经网络预测[A];第一届海峡两岸隧道与地下工程学术与技术研讨会论文集(下册)[C];1999年
10 闵惜琳;;信息系统中基于神经网络的统计需求分析[A];西部开发与系统工程——中国系统工程学会第12届年会论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 陈晓娟;模拟电路神经网络故障诊断方法的研究[D];吉林大学;2006年
2 李新欣;船舶及鲸类声信号特征提取和分类识别研究[D];哈尔滨工程大学;2012年
3 吴建发;优选压裂井方法研究[D];西南石油学院;2005年
4 李军红;冷轧带肋钢筋工艺的现代优化方法及质量控制[D];南昌大学;2006年
5 Han Qiang;[D];山东大学;2005年
6 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
7 申金山;基于人工神经网络的化学发光法及光度法在多组分同时测定中的应用研究[D];四川大学;2005年
8 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
9 张治国;人工神经网络及其在地学中的应用研究[D];吉林大学;2006年
10 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
中国硕士学位论文全文数据库 前10条
1 郭华;基于神经网络的声纹识别系统设计与实现[D];上海交通大学;2008年
2 杨东;基于神经网络的语音识别鲁棒性研究[D];山东师范大学;2005年
3 荣蓉;基于人工神经网络的语音识别研究[D];山东师范大学;2005年
4 许昕;齿轮箱故障诊断在安全生产中的应用[D];中北大学;2007年
5 雷涛;基于神经网络的语音识别研究[D];浙江工业大学;2005年
6 王思俊;基于时频分析的扬声器故障在线检测方法研究[D];天津科技大学;2008年
7 周茉;基于HMM和ANN的汉语数字语音识别算法研究[D];华中师范大学;2006年
8 尹江艳;基于HMM和ANN的语音识别方法[D];吉林大学;2007年
9 董笑盈;基于神经网络和小波分析技术的基因表达谱数据分析[D];北京工业大学;2004年
10 何苗;基于神经网络的宫颈涂片诊断系统的研究与设计[D];东北大学;2005年
中国重要报纸全文数据库 前10条
1 张东方;沙明;杨松松;人工神经网络在中药领域中的应用[N];中国医药报;2003年
2 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
3 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
4 胡性慧 王唯赫 杨腾;人工神经网络拓宽版权贸易路径[N];中国知识产权报;2010年
5 吴玺宏;声纹识别应用前景[N];计算机世界;2001年
6 徐会川;延伸人类智力——人工神经网络[N];电脑报;2003年
7 北京大学信息科学中心视觉与听觉信息处理国家重点实验室 吴玺宏;声纹识别听声辨人[N];计算机世界;2001年
8 本报记者 靖九江 采写;人工神经网络在临床上的应用[N];中国医药报;2005年
9 邢方亮;以声辨人[N];计算机世界;2003年
10 苑希民(中国水利水电科学研究院决策支持技术研究室 主任) 李彦彬 徐建新(华北水利水电学院) 李鸿雁(北京理工大学管理与经济学院) 苑韶峰 吕军(浙江大学环境与资源学院);人工神经网络 灵感源于大脑[N];中国水利报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978