收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于深度学习的声音识别分类系统

肖科  
【摘要】:声音无处不在,人听到声音后,不断地有意识地或潜意识地处理和理解这些音频,从而向我们提供有关周围环境的信息。智能环境声音分类是在众多实际应用中不断发展的研究领域。尽管在音频领域(例如语音和音乐)进行了大量研究,但对环境中的声音进行分类的工作相对较少。而利用深度学习对声音图像化处理后的分类还未出现,这就引出了利用卷积神经网络对随着时间而发生的离散声音信号进行分类的研究。本研究是将深度学习技术应用于环境中声音的分类,使用深度学习技术对生活中的声音进行分类。当给出持续几秒钟的计算机可读格式(例如.wav文件)的音频样本时,希望能够确定它是否是数据集中声音之一以及相应的似然评分。相反,如果未检测到目标声音,我们将获得一个未知分数。主要研究内容如下:(1)声音分类的意义以及在现实中应用声音作为一种携带信息的载体,是人类社会中无法缺少的元素,它包含在人类生活的方方面面。虽然人耳能够有效的识别部分声音,但在更复杂的情况下,其能力是有限的,于是就需要智能的声音分类系统来协助人类识别声音,以达到某些目的。当前,对声音识别分类的应用需求是非常多的,例如协助聋哑人的日常活动、能够内外识别声音的汽车、机器预测性维护,这些应用将有助于改善人们的生活提高人们的工作效率。(2)研究深度学习技术中的卷积神经网络(CNN)对声音图像化处理后的图像进行高精度和大规模分类本课题使用深度学习中CNN技术对生活环境中的声音进行分类,根据需求对采集到的声音数据集进行图像化,然后对声音图像每一帧声音数据进行预处理,以及用梅尔频谱倒谱系数(MFCC)来提取训练模型所需的声音特征,将这些有特征标签的数据集进行分割处理,并将分类标签一起存储在Panda中的Dataframe中,然后再将数据集放入到所建立的声音分类模型中进行训练。(3)优化了声音分类精确度的算法声音分类模型的建立中,涉及到深度学习算法的应用,而一般的基准算法不能达到相应的精度要求,需要在相应模型中进行算法的改进来达到提高识别精度的要求,本文在五种基准模型算法(决策树、KNN、随机森林、支持向量机以及多数投票算法)的基础上,通过改进MLP(多层感知器)模型和CNN(卷积神经网络)模型,将其中的层级结构、特征参数以及每层的模型的节点数等进行优化,创建一个有较高分类精度的声音识别系统。(4)系统测试及算法比较分析研究将8733个时长为几秒钟的.wav文件输入到优化的声音识别分类系统中,系统能够将输入的声音与模型中学习的声音精确匹配,对每一种声音都会给出一个评分,评分最高声音类别即是目标声音的类别。同时将样本声音用上述五种算法以及改进的MLP和CNN模型继续训练,五种基准算法中识别精度最高是SVM为68%,识别精度在改进MLP和CNN模型上分别达到了88%和92%,并在汽车发动机的故障分析上得到了有效的应用。


知网文化
【相似文献】
中国期刊全文数据库 前19条
1 周爱保;胡砚冰;鲁小勇;申莎;关香丽;陈大亮;崔嘉溦;;我听故我在?自我声音识别机制的探索[J];心理科学;2020年03期
2 唐家旭;;声音识别术(上)[J];农村青少年科学探究;2017年04期
3 ;会找人的机器人[J];科学;2006年01期
4 刘砾;日研制成功世界上第一个连续声音识别系统[J];国外自动化;1979年Z1期
5 千叶 ,成美 ,刘小立 ,祝景成;声音识别技术的现状与未来[J];国外自动化;1983年02期
6 Terry Costlow;何蔼;;声音识别,不同凡响[J];科技英语学习;2007年02期
7 ;汽车中的声音识别系统[J];微型轿车;1998年06期
8 冠一;声音识别和控制技术[J];发展论坛;1995年04期
9 张宏超;声音识别简介[J];信息与控制;1979年03期
10 王珏;神奇的声音识别技术[J];中学生;2005年02期
11 彭宁;陈爱斌;周国雄;陈文洁;刘晶;;基于正弦注意力表征网络的环境声音识别[J];应用科学学报;2021年04期
12 李超;;声音识别传感器设计与应用[J];传感器与微系统;2014年12期
13 刘井竹;;基于声音识别的厨房用品设计[J];考试周刊;2010年04期
14 彭旭知;做足VI:品牌声音识别[J];中国中小企业;2005年06期
15 唐宁;;声音识别技术实用化[J];世界知识;1997年06期
16 蓝祥;声音识别技术取得实际进展[J];世界科学;1994年04期
17 杨敬安;一种新型的声音识别与理解系统——OSPARI系统[J];计算机工程;1991年01期
18 Sebastian Rupley ,知遥;带耳朵的PC机[J];个人电脑;1996年09期
19 史秋莹;郑铁然;;基于深度学习的环境声音识别[J];智能计算机与应用;2018年05期
中国重要会议论文全文数据库 前5条
1 杨曜;郭斌;於志文;;一种基于背景声音识别的社会情境感知方法[A];第八届和谐人机环境联合学术会议(HHME2012)论文集PCC[C];2012年
2 高思泽;倪邦发;张贵英;赵常军;肖才锦;刘存兄;刘超;管永精;;过热液滴探测器的声音识别系统设计[A];第十二届全国活化分析学术交流会论文摘要汇编[C];2010年
3 彭少灵;莫雷;;语言对人的声音识别能力的影响[A];第十七届全国心理学学术会议论文摘要集[C];2014年
4 刘振宇;赫晓燕;桑静;李玉婷;武志强;路志明;;基于隐马尔可夫模型的猪咳嗽声音识别的研究[A];中国畜牧兽医学会信息技术分会第十届学术研讨会论文集[C];2015年
5 许小芳;周红生;娄定风;王欢;;基于MFCC的木材钻蛀性害虫声信号识别[A];2012'中国西部声学学术交流会论文集(Ⅱ)[C];2012年
中国博士学位论文全文数据库 前3条
1 张文娟;基于听觉仿生的目标声音识别系统研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2012年
2 张苏楠;生猪异常行为多源监测及其信息融合方法的研究与应用[D];太原理工大学;2020年
3 曹晏飞;复杂背景下蛋鸡声音分类提取方法研究[D];中国农业大学;2015年
中国硕士学位论文全文数据库 前20条
1 肖科;基于深度学习的声音识别分类系统[D];重庆三峡学院;2021年
2 姚艳丽;基于类脑计算方法的鲁棒声音识别[D];天津大学;2019年
3 张智超;基于深度学习的环境声音识别[D];上海大学;2020年
4 俞颂华;基于小波包分解的MFCC在复杂环境声音识别中的应用[D];南宁师范大学;2019年
5 李俊华;基于深度学习方法的环境声音识别[D];福州大学;2018年
6 李兰村;基于声音识别技术的设备监测系统的设计与实现[D];中国科学院大学(中国科学院沈阳计算技术研究所);2019年
7 龚永杰;基于声音识别技术的猪咳嗽音识别方法的研究[D];华中农业大学;2018年
8 柯行思;智能分析方法在声音识别中的应用研究[D];华北电力大学;2018年
9 史秋莹;基于深度学习和迁移学习的环境声音识别[D];哈尔滨工业大学;2016年
10 王亚文;基于神经网络的环境声音识别算法研究[D];电子科技大学;2021年
11 范宽;车辆鸣笛声音识别与定位技术研究[D];北方工业大学;2021年
12 尤冠瑜;基于时间编码的环境声音识别[D];福州大学;2013年
13 颜鑫;真实噪声下利用抗噪幂归一化倒谱系数的两层鲁棒环境声音识别[D];福州大学;2013年
14 赵渊;基于声音识别汽车座椅记忆盒检测系统研究与实现[D];燕山大学;2017年
15 吴弘;空中目标声音识别技术的研究[D];南京理工大学;2004年
16 李权;面向安全监控的异常声音识别的研究[D];湖南师范大学;2015年
17 欧阳桢;优化的匹配追踪用于生态声音识别[D];福州大学;2014年
18 王统;基于循环神经网络的声音识别[D];重庆三峡学院;2020年
19 姜愉;基于ARM平台的发动机声音识别技术的研究及实现[D];广西师范大学;2012年
20 乔齐;长沙常见鸣鸟类声音识别和愉悦度评价[D];中南林业科技大学;2021年
中国重要报纸全文数据库 前6条
1 本报研究员 史庭琦;声音识别系统获新突破 场景辨识技术将成风口[N];上海证券报;2016年
2 重庆商报-上游财经记者 孙琼英;喊“芝麻开门”门就开了 “重庆造”智慧门实现人脸声音识别[N];重庆商报;2017年
3 ;听声音识别嫌疑犯[N];检察日报;2002年
4 本报驻以色列记者 田学科;藏在舌尖上的“身份证”[N];科技日报;2006年
5 本报记者 蒋秀娟实习生 付丽丽;未来十年,计算机将怎样与您亲密接触?(上)[N];科技日报;2008年
6 记者 陈寂;彩电企业争抢双十一商机[N];经济参考报;2017年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978