收藏本站
《中国科学院研究生院(长春光学精密机械与物理研究所)》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

基于听觉仿生的目标声音识别系统研究

张文娟  
【摘要】:目标声音识别技术是声音识别的一个重要分支,它的发展极大地提高了人的工作效率、生活品质和服务质量。但是由于声音变化范围较大,声音识别系统很难进行精确匹配;而且声音容易受音量、音质、速度和背景噪声的影响而降低识别效果。因此,研究并设计具有高识别率和高鲁棒性的目标声音识别系统是十分必要的。 随着声音信号处理技术的深入研究,结果发现人的听觉系统在听音辨物方面具有独特的优越性,它能够准确地提取目标声音特征并精确地识别声音的方向、类别和内容,基于人耳听觉仿生的目标声音识别技术日益受到重视。因此,本文针对基于听觉仿生的目标声音识别技术展开系统研究,积极探索先进的人耳仿生理论、特征提取技术、目标声音分类技术和基于FPGA的识别系统硬件实现方法,全文主要研究内容及成果如下: 1.通过分析人耳听觉系统的生理结构及其对声音的感知过程,研究并建立了一个较为完整的听觉系统数学模型,实现对人耳声音处理过程的模拟。通过仿真实验表明,该数学模型可以较好地模拟耳蜗基底膜的分频滤波功能和内毛细胞的能量转换过程。 2.通过分析比较几种常用的声音特征提取方法,针对其普遍存在的鲁棒性差等问题,提出一种基于听觉谱的声音特征提取方法。该方法采用听觉系统的数学模型对声音进行信号处理,其原理符合人耳对声音的处理过程,能够很好地提取声音的特征量,避免关键信息的丢失,提高系统的抗噪声性能和识别率。 3.通过对常用几种模式识别方法的对比研究,综合考虑声音具有非线性的特点,本文选择具有自适应能力强的BP神经网络对目标声音信号进行识别及分类处理,该方法思想直观,数学意义明确。通过仿真实验表明:采用BP神经网络设计的分类器对所有测试样本的平均识别率达到93.14%,这说明此方法对目标声音特征进行分类识别是行之有效的。 4.在听觉系统数学模型、听觉谱特征提取方法和BP神经网络识别算法已有研究的基础上,综合考虑算法的复杂程度、所需的硬件资源和对外接口等问题,本文提出采用FPGA嵌入式开发平台完成目标声音识别系统的硬件设计。该硬件系统采用VHDL硬件描述语言来模拟耳蜗基底膜的分频功能并设计了基底膜滤波器,采用NOIS II软核技术实现内毛细胞数学模型、耳蜗核数学模型、基于听觉谱的特征提取算法和基于BP神经网络的分类器。最后,针对大炮、救护车、轮船、火车和飞机滑行这5种不同目标声音,在基于FPGA的目标声音识别系统上进行了多次识别实验。测试结果表明,5类目标声音测试集中对救护车的测试样本识别率最高,达到了97.14%,而对大炮的测试样本识别率最低,达到85.71%,所有测试样本的平均识别率达到91.43%。实验结果证明,利用FPGA硬件实现的听觉仿生系统具有良好的识别效果,整个方案是可行且有效的。 本文将听觉仿生技术和FPGA硬件技术成功地应用在目标声音识别系统中,为相关技术的研究和工程实践提供了理论支持和技术参考。
【学位授予单位】:中国科学院研究生院(长春光学精密机械与物理研究所)
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TN912.34

【参考文献】
中国期刊全文数据库 前10条
1 刘福林;;仿生学发展过程的分析[J];安徽农业科学;2007年15期
2 辛忻;车辆的声音识别技术[J];鞍山科技大学学报;2004年02期
3 马元锋;陈克安;马苗;张成;;一种新的可应用于声目标识别的倒谱系数[J];兵工学报;2009年11期
4 郭利刚;赵凡;;声音匹配识别算法的研究与实践[J];中国传媒大学学报(自然科学版);2007年01期
5 高雨青,黄泰翼,陈韶岩;听觉模型用于语音识别以及与一般方法的比较[J];电子学报;1993年10期
6 刘鸣,戴蓓倩,李辉,陆伟,李霄寒;鲁棒性话者辨识中的一种改进的马尔科夫模型[J];电子学报;2002年01期
7 王玥;钱志鸿;王雪;程光明;;基于伽马通滤波器组的听觉特征提取算法研究[J];电子学报;2010年03期
8 杨俊,樊昌信;听觉模型及其应用[J];电子科学学刊;1992年01期
9 卢小春;尹俊勋;王修信;;基于听觉模型特征的与文本无关说话人识别系统[J];广西师范大学学报(自然科学版);2010年02期
10 李振国;宋吉江;李月然;;基于虚拟仪器的声音识别系统设计[J];山东理工大学学报(自然科学版);2011年01期
中国博士学位论文全文数据库 前5条
1 宁更新;抗噪声语音识别新技术的研究[D];华南理工大学;2006年
2 吴川;基于神经网络的目标识别及定位方法的研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2006年
3 梁杰;基于双耳听觉模型的车内声品质分析与评价方法研究[D];吉林大学;2007年
4 李思纯;基于矢量水听器的目标特征提取与识别技术研究[D];哈尔滨工程大学;2008年
5 吴占稳;起重机的声发射源特性及识别方法研究[D];武汉理工大学;2008年
中国硕士学位论文全文数据库 前8条
1 陈雪勤;基于计算声场景分析的混叠语音分离研究[D];苏州大学;2002年
2 吴岳松;基于听觉模型的水下目标识别研究[D];西北工业大学;2005年
3 夏辉达;基于DSP的战场声目标识别技术的研究[D];中北大学;2006年
4 胡志峰;基于嵌入式声音识别技术的列车预警研究[D];西南交通大学;2007年
5 张文娟;基于NIOS Ⅱ多核技术的BP神经网络的硬件实现方法研究[D];东北师范大学;2009年
6 曹慧敏;基于海上侦察系统的声音识别技术研究[D];南京理工大学;2010年
7 张晓辉;基于ZCPA特征参数的口令识别系统[D];中国科学技术大学;2010年
8 董伟;特征提取及特征优选在车辆声识别中的应用研究[D];中北大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 刘福林;;仿生学应用中的制约因素分析[J];安徽农业科学;2007年14期
2 刘福林;;仿生学发展过程的分析[J];安徽农业科学;2007年15期
3 朱再满;张长征;罗勋;孙庆艳;梅斌;华田苗;;5-HT在青年和老年猫腰髓中分布的比较研究[J];安徽师范大学学报(自然科学版);2006年02期
4 杜广超;杨凯;王胜涛;;语音编码和图像编码比较研究[J];兵工自动化;2008年07期
5 刘伟,袁修干;视觉——目标拾取认知技术的研究及思考[J];北京航空航天大学学报(社会科学版);2001年04期
6 崔逊学;刘綦;赵温波;邱国新;邢立军;;基于磁传感器的地面机动目标分类算法[J];兵工学报;2009年08期
7 马元锋;陈克安;马苗;张成;;一种新的可应用于声目标识别的倒谱系数[J];兵工学报;2009年11期
8 阮鸿宇,张人骥;螯虾尾神经节光敏神经元反应的适应特性及信号通路检测[J];北京大学学报(自然科学版);1999年06期
9 牛滨;孔令志;罗森林;潘丽敏;郭亮;;基于MFCC和GMM的个性音乐推荐模型[J];北京理工大学学报;2009年04期
10 刘刚;叶大田;;针对汉语声母发音的辅助教师系统的研究[J];北京生物医学工程;2008年02期
中国重要会议论文全文数据库 前10条
1 王如彬;周轶;张志康;;具有延时作用的基底膜主动耦合模型[A];第十三届全国非线性振动暨第十届全国非线性动力学和运动稳定性学术会议摘要集[C];2011年
2 陶伯华;;智慧思维学精要——《思维科学概论》第十篇[A];中国思维科学研究论文选2011年专辑[C];2012年
3 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
4 王金明;张雄伟;;基于子带加权和GMM的鲁棒性话者确认的研究[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
5 马治飞;徐望;王炳锡;王兴斌;;一种基于概率模型和倒谱差分的特征补偿算法[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
6 王兴斌;徐望;王炳锡;马治飞;;噪声环境下语音能量的MMSE估计及其在语音识别中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
7 徐小峰;胡央芳;刘守快;郑翔;俞一彪;王宇岭;王庆才;戴云;李道明;;基于VQ算法的病症脉象识别[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
8 潘欣裕;董兴法;赵鹤鸣;;基于谱能比例加权的谱减法语音增强研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
9 展领;景新幸;;矢量量化和VQ-UBM在说话人确认中的应用[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
10 汉小欢;景新幸;;一种级联的特征参数提取方法[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 汪延成;仿生蜘蛛振动感知的硅微加速度传感器研究[D];浙江大学;2010年
3 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
4 李金津;企业生态链理论研究[D];吉林大学;2011年
5 张俊秋;耦合仿生抗冲蚀功能表面试验研究与数值模拟[D];吉林大学;2011年
6 付子英;下丘神经元对不同声刺激模式的反应特性研究[D];华中师范大学;2011年
7 刘德胜;创新型中小企业基因及作用机理研究[D];山东大学;2011年
8 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
9 高翔;浅埋地层探地雷达信号处理与目标识别研究[D];中国海洋大学;2011年
10 陈方涵;小波理论在光学相关探测中的研究与应用[D];长春理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 李锦;基于声波的运动车辆行驶状态辨识理论研究[D];南昌航空大学;2010年
2 李全;驱动滚筒仿生表面增摩技术研究[D];山东科技大学;2010年
3 李建华;动物行为控制无线通信系统研究[D];郑州大学;2010年
4 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
5 于凤楠;双谱分析方法在水下目标特征提取中的应用[D];哈尔滨工程大学;2010年
6 杨青;手势识别技术的研究[D];大连理工大学;2010年
7 时筱惠;大连方言语音对英语语音习得的影响[D];辽宁师范大学;2010年
8 张宇;基于倒谱特征的说话人识别方法研究[D];大连海事大学;2010年
9 刘亚玉;限定性文本的语料库自动构建[D];中国海洋大学;2010年
10 郭秋雨;小词汇量非特定人的孤立词语音识别系统研究[D];中国海洋大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 梁艳;靳东明;;基于CMOS模拟电路的径向基函数神经网络[J];半导体学报;2008年02期
2 陈渊;胡伟文;胡韬;;基于小波能量谱的舰船辐射噪声分类特性分析[J];兵工自动化;2009年10期
3 栗苹,崔占忠,施聚生;声目标识别技术及其在坦克目标识别中的应用[J];兵工学报;1996年01期
4 章新华;水下目标自动识别的核心技术[J];兵工学报;1998年03期
5 马元锋;陈克安;马苗;张成;;一种新的可应用于声目标识别的倒谱系数[J];兵工学报;2009年11期
6 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
7 郭利刚;赵凡;;声音匹配识别算法的研究与实践[J];中国传媒大学学报(自然科学版);2007年01期
8 焦敬品,李涌,何存富,吴斌,费仁元;压力管道泄漏的声发射检测实验研究[J];北京工业大学学报;2003年02期
9 李昂;王沁;李占才;万勇;;基于FPGA的神经网络硬件实现方法[J];北京科技大学学报;2007年01期
10 黄石磊,武剑虹,匡镜明;用于语音识别的减谱结合RASTA的抗噪声方法[J];北京理工大学学报;2003年05期
中国博士学位论文全文数据库 前5条
1 欧阳缮;主分量和次分量神经网络学习算法及应用[D];西安电子科技大学;2000年
2 许廷发;GABOR小波神经网络算法及其在灰度图象目标识别中的应用研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2004年
3 张翠;高分辨率SAR图像自动目标识别方法研究[D];国防科学技术大学;2003年
4 张葛祥;雷达辐射源信号智能识别方法研究[D];西南交通大学;2005年
5 黄琦;智能传感器侦察网络中的地面目标识别算法研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 韩萍;仓储物害虫声音模式识别的研究[D];郑州大学;2001年
2 陈丹;战场被动声多目标识别方法研究[D];西北工业大学;2005年
3 张宇波;声音信号识别研究及在机械运行状态预测中的应用[D];湖南大学;2005年
4 夏辉达;基于DSP的战场声目标识别技术的研究[D];中北大学;2006年
5 赵航;基于DSP的嵌入式实时监控器系统的设计与实现[D];西安电子科技大学;2006年
6 黄英来;基于动物声音的个体辨认技术的研究[D];东北林业大学;2006年
7 王娜;基于人耳主观反应的听觉特征量及其在目标识别中的应用[D];西北工业大学;2006年
8 姜涛;嵌入式交通工具声音感知系统的研究与实现[D];哈尔滨工业大学;2006年
9 胡冰山;基于DSP的故障录波器设计[D];哈尔滨理工大学;2006年
10 朱廉洁;汽车发动机空气滤清器消声特性研究[D];哈尔滨工程大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 王想实;刘培林;;计算听觉场景的算法研究[J];电脑与电信;2010年01期
2 容茂成;祖丽楠;杨鹏;;移动机器人听觉定位技术研究[J];机器人技术与应用;2008年04期
3 沈圆圆;顾济华;陶智;赵鹤鸣;谈雪丹;;基于人类听觉系统的多频带语音增强[J];计算机工程与应用;2011年21期
4 容茂成;祖丽楠;杨鹏;;移动机器人听觉定位技术研究[J];机器人技术与应用;2009年01期
5 杨俊,樊昌信;听觉模型及其应用[J];电子与信息学报;1992年01期
6 职新卫;;基于Matlab的声场展宽技术研究[J];光盘技术;2008年01期
7 李朝晖;迟惠生;;听觉外周计算模型研究进展[J];声学学报(中文版);2006年05期
8 姚剑清;音乐数据如何压缩(上)[J];电子产品世界;2002年11期
9 李晶皎,孙杰,姚天顺;基于听觉及小波变换的汉语语音调值分析[J];控制与决策;1998年06期
10 张亮,卞正中,高迎春,缪亚林;基于人类听觉的伪随机序列的信息隐藏技术[J];计算机工程;2004年22期
中国重要会议论文全文数据库 前10条
1 成彬彬;张海;;听觉系统内毛细胞Meddis模型的分析与仿真[A];'2008系统仿真技术及其应用学术会议论文集[C];2008年
2 齐娜;李莉;赵伟;;中国成年人耳廓形态测量及分类[A];2008年声频工程学术交流年会论文集[C];2008年
3 朱光洁;徐琳;范迟;张文程;何伟奇;彭亚静;朱敏生;高下;;细胞骨架调节因子MLCK在内毛细胞中参与听觉传导通路的作用机制研究[A];2010全国耳鼻咽喉头颈外科中青年学术会议论文汇编[C];2010年
4 赵祥辉;龙长才;;噪声增强内毛细胞非线性信号转换的适应性[A];中国声学学会2006年全国声学学术会议论文集[C];2006年
5 龙长才;秦佑国;;听神经自发发放的积分统计模型[A];中国声学学会2001年青年学术会议[CYCA'01]论文集[C];2001年
6 余力生;;耳鸣概论[A];中华中医药学会耳鼻喉科分会第15届学术交流会论文集[C];2009年
7 阮清伟;时海波;李春燕;殷善开;王正敏;;螺旋神经节细胞增殖和生存需要内毛细胞源性自发活性[A];中华医学会第十次全国耳鼻咽喉-头颈外科学术会议论文汇编(上)[C];2007年
8 杨琳;戴培东;华诚;张天宇;丁光宏;王克强;王正敏;;盖膜与内毛细胞静纤毛相互作用的生物力学分析[A];2008年全国生物流变学与生物力学学术会议论文摘要集[C];2008年
9 赵祥辉;龙长才;;内毛细胞到听神经信号转换中的随机共振[A];中国声学学会2006年全国声学学术会议论文集[C];2006年
10 李淑荣;赵玉珍;张连巍;雷建章;;豚鼠内耳螺旋器毛细胞的超微结构特征[A];第十二届全国电子显微学会议论文集[C];2002年
中国重要报纸全文数据库 前10条
1 王丽;耳鸣提示什么[N];民族医药报;2009年
2 刘霞;让老人拔萝卜不腰疼[N];科技日报;2010年
3 ;低调美丽,静水流深[N];21世纪经济报道;2008年
4 董飞侠;把耳朵叫醒[N];医药经济报;2009年
5 本报记者 蒋秀娟实习生 付丽丽;未来十年,计算机将怎样与您亲密接触?(上)[N];科技日报;2008年
6 ;耳鸣怎么办[N];中国质量报;2000年
7 王峰;了解耳鸣防疾病[N];中国消费者报;2000年
8 专家:吉林大学第一医院耳鼻咽喉科主任医师 张桂茹 采访 李荔;神奇“蚊音”能测年龄?[N];北京科技报;2011年
9 杨元德;怎样减轻老年耳鸣[N];卫生与生活报;2003年
10 汪海 刘芃;知觉训练重塑大脑皮层功能[N];上海科技报;2009年
中国博士学位论文全文数据库 前10条
1 张文娟;基于听觉仿生的目标声音识别系统研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2012年
2 赵祥辉;听觉系统对噪声信号的非线性效应[D];华中科技大学;2012年
3 王晓;听觉中枢对刺激时程和强度的时间反应特性[D];南方医科大学;2010年
4 谭晓东;小鼠下丘神经元对声音刺激频率和强度的时间反应特性[D];南方医科大学;2008年
5 孙景阳;压电式骨传导听觉装置振动器结构设计与试验研究[D];吉林大学;2010年
6 王庆生;微型生物听觉系统的定向机理及仿生声感应结构的设计和实验研究[D];上海交通大学;2010年
7 鲁海涛;内毛细胞损伤动物模型的建立及其电生理研究[D];华中科技大学;2010年
8 李克勇;听觉系统声诱发反应的磁声场记录[D];中国协和医科大学;1996年
9 陈蓓;D-半乳糖老年性聋动物模型听觉中枢的改变及机制研究[D];华中科技大学;2010年
10 陈蓓;D-半乳糖拟老化大鼠听觉中枢的改变及机制研究[D];华中科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 罗海风;听觉系统中语音信号处理相关性质研究[D];华中科技大学;2011年
2 廖启鹏;基于Gammatone听觉滤波器组和复倒谱盲解卷积的语音去混响研究[D];苏州大学;2012年
3 邱会军;耳鸣患者的听觉与非听觉问题的相关研究[D];大连医科大学;2010年
4 谷岳;移动机器人听觉导航系统中语音分离技术研究[D];河北工业大学;2011年
5 郭伟;基于听觉神经原理的语音信号处理[D];上海交通大学;2009年
6 许靓;城市及边远地区正常成年人群听觉调查资料统计分析[D];南京中医药大学;2011年
7 许兵;基于Gammatone滤波器的触觉替代听觉系统的研制[D];浙江工商大学;2013年
8 周昕;高胆红素血症对新生豚鼠听觉系统功能影响的实验研究[D];南方医科大学;2009年
9 王娜;基于人耳主观反应的听觉特征量及其在目标识别中的应用[D];西北工业大学;2006年
10 唐小兰;大鼠螺旋神经节神经元GABA_A受体、NMDA受体亚单位表达研究[D];广西医科大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026