收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于深度学习的声源目标识别加速器设计

杨树兰  
【摘要】:听觉是人类感知周围环境的一个重要途径,通过听声音我们可以获取众多信息。声音识别目前被应用于多个领域,具有巨大的生产生活价值,其中语音识别技术已经比较成熟,而环境声音由于其复杂性,成熟程度和应用程度远不如语音识别。声音识别在初期是通过提取音频的传统声学特征,再用统计分析进行分类的方法实现的。近年来,深度学习(Deep Learning)飞速发展,被应用于包括声音识别在内的众多领域。深度学习在声音识别领域的应用,大幅提升了环境声音识别准确率。人工神经网络是深度学习的基础。随着应用场景的愈发复杂,神经网络算法也变得更为复杂,且规模不断增大。声音识别是应用型技术,只有准确率高、识别速度快才能被实际应用。目前靠指令流的通用处理器的计算速度、存储资源、带宽等难以满足深度越来越大的神经网络的计算需求,因此大家将目光转向了专用集成电路(Application Specific Integrated Circuit,ASIC)和现场可编程逻辑器件(Field Programmable Gate Array,FPGA)等硬件平台上。在硬件平台上数据计算不依靠指令,而是以流水线方式移动,因此计算速度较处理器更快。本文将环境声音数据集Ubandsound8K中十种声源目标的快速准确分类作为设计目标,把深度学习与专用计算硬件结合,设计了一个基于深度学习的专用硬件计算电路。该系统识别方案是通过提取音频的梅尔频谱(Mel Spectrum),然后将其输入卷积神经网络(Convolutional Neural Networks,CNN)以提取高级特征实现分类实现的。设计实现的硬件加速器包括两个模块,分别是梅尔频谱提取模块和CNN模块。梅尔频谱提取模块由预加重模块、分帧加窗模块、FFT计算模块、Mel滤波器模块以及控制模块五个子模块组成。CNN模块以前向加速为目标设计了一种逐层计算的硬件计算架构。CNN模块中设计了一个共享计算模块,所有卷积层与全连接层均通过该模块计算,在计算前根据控制模块的控制信号配置共享计算模块。论文分析了CNN的算法特点,根据各层特点设计了输入通道并行、输出通道并行和卷积核内并行三种并行计算方法,实现了数据在空间上的复用。最后,在Xilinx的Vivado设计环境下实现了加速器系统的设计、综合以及自下而上的模块仿真验证,并在CPU、GPU和本文设计的专用计算电路上使用同种网络模型识别图片,对比各个平台的识别速度。本文设计实现的声源识别专用加速器并行度高、识别性能以及识别速度较高,相较于测试所用的CPU和GPU,识别时间分别降低71.9%和38%。


知网文化
【相似文献】
中国期刊全文数据库 前16条
1 葛蕴珊,黎志勤,刘仕民;复数声强与声源识别[J];吉林工业大学学报;1992年04期
2 李婧;黄震宇;;基于麦克风阵列的声源识别研究[J];电气自动化;2013年04期
3 李岩;王亚芳;蔡畅;苗兵梅;;基于等效源法对移动声源辐射声场的重建与识别研究[J];通信技术;2017年10期
4 张翠青;韦丽珍;;运动声源识别研究现状分析[J];价值工程;2020年04期
5 沈哲;杨志刚;王勇;王毅刚;贺银芝;;汽车风洞中波束成形声源识别技术应用进展[J];汽车工程学报;2020年06期
6 张袁元;李舜酩;胡伊贤;郭海东;雷衍斌;;某型联合收割机的多相关声源识别[J];振动.测试与诊断;2013年01期
7 刘玉财;陈毅;易文胜;杨柳青;;基于逆频响函数法的浅水域目标水下辐射声源级反演[J];宇航计测技术;2020年06期
8 李楠;李思阳;刘晶;王倩;陈艾婷;洪梦迪;冀飞;;正常人全方向72声源水平定位能力初步研究[J];转化医学杂志;2021年04期
9 邓轩;;基于谐和与击打声源分离相结合的音乐分离方法研究[J];自动化技术与应用;2021年08期
10 刘小龙;李宁;雷开卓;李洪兵;;水下等离子体声源的电声转换模型研究与计算[J];高技术通讯;2021年10期
11 杨殿阁;张凯;苗丰;温俊杰;连小珉;;运动声源快速定位的声达时差法[J];声学学报;2020年01期
12 曹亮;韩引海;谢辉;;定深爆炸声源声信号能量分配试验研究[J];声学技术;2020年01期
13 王芳莹;张三明;;两种用于声学缩尺模型的声源研制[J];声学技术;2019年06期
14 秦煜;赵巍;康健;;养老设施活动空间背景声源类型对情绪及活动的影响[J];西部人居环境学刊;2020年04期
15 张天;张天骐;葛宛营;喻盛琪;;融合声源分离及反复结构模型的音乐分离方法[J];声学学报;2020年05期
16 戴江安;邱天爽;;基于检测前跟踪的声源跟踪算法[J];通信学报;2017年02期
中国重要会议论文全文数据库 前20条
1 郭小霞;杨德森;时胜国;马佳男;;基于声压-振速联合处理的相干声源分离技术研究[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
2 赵云;龚昌超;田章福;周鹤峰;;无负压源的推挽调制声源仿真与实验研究[A];2019年全国声学大会论文集[C];2019年
3 范京;罗倩;曾义芳;;平面麦克风阵列估计声源的方向和距离[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
4 罗林;何培宇;潘帆;;一种利用门限值实现耳鸣匹配声源多样化的新方法[A];全国第五届信号和智能信息处理与应用学术会议专刊(第一册)[C];2011年
5 孙军平;衣雪娟;林建恒;蒋国健;江鹏飞;李家亮;;利用偶发声源对水下目标监测初探[A];2012'中国西部声学学术交流会论文集(Ⅰ)[C];2012年
6 代雪峰;李震宇;付淼;陈伟;;气动声源系统在试验中的应用[A];第十届船舶水下噪声学术讨论会论文集[C];2005年
7 饶丹;谢菠荪;;声源指向性对双耳可听化质量的影响[A];2005年声频工程学术交流会论文集[C];2005年
8 饶丹;谢菠荪;;声源指向性对双耳可听化质量的影响[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年
9 叶超;匡正;纪伟;姬培锋;杨军;;多通路高指向性声频声源的实验研究[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年
10 戴丹蕾;王浩;;基于虚拟声源的分层结构超声成像方法[A];2016年全国声学学术会议论文集[C];2016年
11 徐国军;李伟;易汉如;;一种基于单水听器的水下目标声源测距方法[A];中国声学学会水声学分会2013年全国水声学学术会议论文集[C];2013年
12 侯宏;杨建华;;有源消声中声源电声阻抗规律的实验研究[A];中国声学学会1999年青年学术会议[CYCA'99]论文集[C];1999年
13 许颖;姚秋平;;标准声源声功率级的半消声室检测法[A];湖北省声学学会成立二十周年纪念文集[C];2006年
14 叶利剑;冯涛;刘克;;管道系统声源双端口模型测量方法理论[A];中国声学学会2007年青年学术会议论文集(下)[C];2007年
15 于;张明敏;;小型水下爆炸声源的声学特性分析[A];2007’促进西部发展声学学术交流会论文集[C];2007年
16 张小川;孙芹东;王超;田德艳;;模块化声源参数仿真研究[A];2018年全国声学大会论文集 P声学测量与仪器 Q声学换能器 S声学教育[C];2018年
17 李倩倩;;不确知海洋环境下运动声源跟踪算法研究[A];中国声学学会水声学分会2015年学术会议论文集[C];2015年
18 刘昱;饶丹;;主成分分析在多声源实时模拟的应用[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
19 张维;马登永;杨军;;参量阵声源的时反聚焦实验研究[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
20 李倩倩;阳凡林;张凯;孙梅;;基于贝叶斯算法的声源运动参数估计方法[A];2016年全国声学学术会议论文集[C];2016年
中国博士学位论文全文数据库 前20条
1 王子腾;高速车辆的声源定量识别方法[D];清华大学;2014年
2 张冰瑞;基于冲击声的声源物理属性辨识及声线索提取[D];西北工业大学;2015年
3 白宗龙;基于稀疏贝叶斯学习的声源方位角估计算法研究[D];哈尔滨工业大学;2021年
4 杨天文;基于神经网络的参量声源非线性建模及控制[D];电子科技大学;2013年
5 丁浩;可识别声源深度的三维声聚焦波束形成方法研究[D];浙江工业大学;2013年
6 张翼鹏;空气中声源产生的水下声场建模与分析[D];西北工业大学;2007年
7 段睿;深海环境水声传播及声源定位方法研究[D];西北工业大学;2016年
8 刘志朋;基于洛伦兹力散度声源的磁声成像关键技术研究[D];北京协和医学院;2013年
9 赵云;大功率调制气流声源的数值模拟与实验研究[D];国防科学技术大学;2010年
10 沈林邦;快速迭代收缩阈值波束形成声源识别方法研究[D];重庆大学;2019年
11 邱枫;储罐底板腐蚀声源特性与严重度分析方法研究[D];东北石油大学;2016年
12 黎术;基于声阵列的广义逆声源识别方法研究[D];重庆大学;2017年
13 张海滨;列车轴承轨边声学故障信号的声源分离及其去噪研究[D];中国科学技术大学;2016年
14 刘松;基于相位共轭方法进行声源识别和定位[D];大连理工大学;2011年
15 平国力;基于稀疏表征的球面阵声源识别理论及算法研究[D];重庆大学;2019年
16 刘志红;声辐射预估理论及其应用研究[D];青岛理工大学;2010年
17 张翠青;风力机叶片绕流声源识别及其流动特征的实验研究[D];内蒙古工业大学;2021年
18 饶丹;双耳可听化质量及其影响因素的研究[D];华南理工大学;2009年
19 葛骑岐;低频VI型弯张小尺寸声源研究[D];哈尔滨工程大学;2013年
20 孙昊;基于声达时间差的移动机器人声源目标定位方法研究[D];河北工业大学;2012年
中国硕士学位论文全文数据库 前20条
1 杨树兰;基于深度学习的声源目标识别加速器设计[D];大连理工大学;2021年
2 王鹏程;基于深度学习的声源目标识别方法研究[D];中北大学;2021年
3 邓怡情;水下运动声源的低频声透射[D];南京大学;2013年
4 盛傅文;基于广义互相关和卷积神经网络的声源定位方法研究[D];山东大学;2020年
5 张鑫;混合时频域旋转声源识别方法研究[D];重庆大学;2019年
6 梅东挺;波束形成原理结合平面阵列识别定位三维声源的方法研究[D];浙江工业大学;2012年
7 樊志文;分布式声源汇聚技术研究[D];国防科学技术大学;2012年
8 李有哲;波束形成技术在声源识别中的运用[D];合肥工业大学;2012年
9 郑谢;运动声源的识别与测量方法研究[D];中国空气动力研究与发展中心;2016年
10 张艳娜;基于麦克风阵列的多声源定位算法研究[D];沈阳航空航天大学;2014年
11 夏洁;多场景中麦克风阵列声源溯源的研究与实现[D];南京师范大学;2020年
12 秦晓辉;气动式报警声源发声机理及数值仿真研究[D];哈尔滨工程大学;2007年
13 刘鹏飞;基于无线传感器网络的声源目标搜寻多机器人系统[D];哈尔滨工业大学;2010年
14 秦煜;养老设施活动空间背景声源类型对情绪及生理指标的影响[D];哈尔滨工业大学;2020年
15 陈勇;基于随钻声波遥传的新型声源研究[D];西安石油大学;2017年
16 梁上烈;利用声源信息的多目标定位与跟踪研究[D];电子科技大学;2016年
17 龙学焜;基于麦克风阵列的近场多声源目标定位与跟踪[D];南昌大学;2016年
18 杨超;声源二维定位估计算法研究[D];沈阳理工大学;2011年
19 许飞;单声源与多声源发声条件下的听觉似动特点研究[D];浙江大学;2007年
20 张劲松;迭代修正的正交匹配追踪反卷积波束形成声源识别方法研究[D];重庆大学;2019年
中国重要报纸全文数据库 前10条
1 记者 程晓东;“今声源”在京横空出世[N];北京科技报;2000年
2 通讯员 赵斌学 万波 吴少威;声源弹在长庆气田应用成功[N];中国石油报;2011年
3 本报记者 姜洪;会上“十大好声音”[N];检察日报;2014年
4 ;具备车辆缉查布控、目标识别等功能[N];人民公安报;2016年
5 沈杰;目标识别摆脱“计划依赖症”[N];解放军报;2020年
6 本报记者 俞陶然;有了消音“神器” 广场舞不再扰民[N];解放日报;2021年
7 ;什么是B制式立体声?[N];中国电子报;2002年
8 本报研究员 史庭琦;声音识别系统获新突破 场景辨识技术将成风口[N];上海证券报;2016年
9 重庆商报-上游财经记者 孙琼英;喊“芝麻开门”门就开了 “重庆造”智慧门实现人脸声音识别[N];重庆商报;2017年
10 本报记者  祝振强 通讯员  谷少平;返乡创业正逢时[N];中国劳动保障报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978