收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于深度学习的语音识别应用研究

张建华  
【摘要】:随着智能家居、车载语音系统以及各种语音识别软件流行,语音识别逐渐走进人们的视野,凭借其实用性准确性得到了广大用户的喜爱,同时语音识别作为人机交互的重要接口,成为人工智能领域研究的重点。在大数据的背景下,深度学习得到长足的发展,由于它对海量数据超强的建模能力,被广泛应用与图像、语音识别,并取得了惊人的效果。考虑到理论意义和实用价值,在深度学习的基础上研究语音识别是一个可行的方向。深度学习是一种多层非线性变换网络,通过大量的有监督参数调整计算来建模数据间的复杂关系。本文详细介绍了语音识别以及深度学习的基本原理,然后阐述了怎样将深度学习高效的应用与语音识别中。 1、基于深度神经网络的声学特征提取研究 深度神经网络是一种有监督训练的多层网络,主要用于分类问题,但是截取它的一部分训练好的网络用于特征转换,新生成的特征在语音识别上相比于MFCC特征也有很好的表现。本文主要从深度神经网络的预训练、参数调整、系统优化方面进行了研究,并在Kaldi平台上搭建了用于语音特征提取的深度神经网络,从MFCC特征中提取鲁棒性区分性更强的语音特征,并用这些新特征训练基于GMM-HMM的声学模型搭建语音识别系统,最好的DNN网络与原始MFCC训练的声学模型搭建的系统相比,在词错误率和句错误率上下降了1.98%和4.21% 2、基于深度神经网络的声韵母属性提取研究 声韵母属性属于语音属性的一种,它可以看做是语音识别中比声韵母更小的基元,用这种粒度更小的基元更能细致的描述语音现象,而且这种方法在以前语音基于概率统计的基础上加入了语音知识的东西,提高系统的识别性能。本文主要研究了语音属性的基础理论,并从语音属性的提取入手,结合了深度学习的原理,搭建了语音属性提取器,用提取出的语音属性搭建了基于GMM-HM M和基于DNN-HMM的声韵母识别器,通过与MFCC搭建的声韵母识别器比较,在声韵母识别率上分别有0.65%和1.37%的提升,通过与MFCC搭建的语音识别器比较,在词识别错误率上有5.61%的下降。 3、基于深度学习的声学建模研究 有监督的深度网络本质上是区分性模型,通过用建模能力强大的深度网络取代浅层GMM模型做状态输出,并与HMM模型结合训练声学模型。在Kaldi上分别实现了基于GMM-HMM、基于DNN-HMM和基于CNN-HMM,并在863语料上通过实验证明了基于DNN-HMM和基于CNN-HMM的声学模型搭建的系统比GMM-HMM的系统在词识别错误率上分别有7.98%和9.01%的下降。并对三种方法进行了比较分析。


知网文化
【相似文献】
中国期刊全文数据库 前16条
1 黄晓辉;李京;;基于循环神经网络的藏语语音识别声学模型[J];中文信息学报;2018年05期
2 张文宇;刘畅;;卷积神经网络算法在语音识别中的应用[J];信息技术;2018年10期
3 唐美丽;胡琼;马廷淮;;基于循环神经网络的语音识别研究[J];现代电子技术;2019年14期
4 秦楚雄;张连海;;低资源语音识别中融合多流特征的卷积神经网络声学建模方法[J];计算机应用;2016年09期
5 徐雪珂;;深度学习在智慧司法中的应用研究[J];电脑知识与技术;2018年22期
6 张晴晴;刘勇;王智超;潘接林;颜永红;;卷积神经网络在语音识别中的应用[J];网络新媒体技术;2014年06期
7 更藏措毛;黄鹤鸣;;双向循环神经网络在语音识别中的应用[J];计算机与现代化;2019年10期
8 王晓明,郑宝玉;一种面向语音识别的新型神经网络[J];南京邮电学院学报;1998年04期
9 顾明亮;神经网络语音识别新特征[J];徐州师范大学学报(自然科学版);1998年02期
10 冯诗影;韩文廷;金旭;迟孟贤;安虹;;循环神经网络在语音识别模型中的训练加速方法[J];小型微型计算机系统;2018年12期
11 刘方爱;王倩倩;郝建华;;基于深度神经网络的推荐系统研究综述[J];山东师范大学学报(自然科学版);2021年04期
12 岳有军;孙碧玉;王红君;赵辉;;基于级联卷积神经网络的番茄果实目标检测[J];科学技术与工程;2021年06期
13 胡瑞敏,薛东辉,姚天任,黄铁侠;神经网络方法及其在语音识别中的应用[J];高技术通讯;1995年06期
14 易生;梁华刚;茹锋;;基于多列深度3D卷积神经网络的手势识别[J];计算机工程;2017年08期
15 阳景;潘强;潘红兵;;基于时间卷积网络的模拟电路故障诊断方法[J];电子测量技术;2019年05期
16 杨洋;汪毓铎;;深度学习在语音识别声学建模中的应用[J];电脑知识与技术;2018年18期
中国重要会议论文全文数据库 前20条
1 杨晋仪;张鹏远;潘接林;颜永红;;小资源下基于神经网络的声学建模[A];中国声学学会第十一届青年学术会议会议论文集[C];2015年
2 彭瑾;刘必慰;陈胜刚;刘畅;;神经网络压缩模型的解压算法设计及其硬件实现[A];第二十二届计算机工程与工艺年会暨第八届微处理器技术论坛论文集[C];2018年
3 杨学增;方棣棠;;神经网络用于语音识别初探[A];第一届全国人机语音通讯学术会议(NCMMSC1990)论文集[C];1990年
4 陈伟辉;孙阳;陈杰;倪玮;陈冲;薛超;;基于深度学习的地震识别技术展望[A];国家安全地球物理丛书(十四)——资源·环境与地球物理[C];2018年
5 徐梦洋;;基于深度学习的行人再识别研究综述[A];中国计算机用户协会网络应用分会2018年第二十二届网络新技术与应用年会论文集[C];2018年
6 张婷;刘允刚;;基于改进卷积神经网络的语音分离方法[A];第36届中国控制会议论文集(C)[C];2017年
7 王子腾;纪璇;王晓飞;付强;颜永红;;面向语音识别的深度映射网络谱/特征增强方法[A];第十三届全国人机语音通讯学术会议(NCMMSC2015)论文集[C];2015年
8 易江燕;陶建华;刘斌;温正棋;;基于迁移学习的鲁棒语音识别声学建模方法[A];第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集[C];2017年
9 文成义;何海燕;张玉扶;;基于新型神经网络的不定人语音识别[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年
10 王杰;王敦泽;陈运达;;基于CNN-TDNN语音识别的噪声鲁棒性方法[A];2019年全国声学大会论文集[C];2019年
11 王辉;杨杰;黎明;蔡念;;一种基于神经网络的图像复原方法[A];2006年全国光电技术学术交流会会议文集(D 光电信息处理技术专题)[C];2006年
12 李飞;赵生妹;郑宝玉;;量子神经网络及其在语音识别中的应用[A];第八届全国人机语音通讯学术会议论文集[C];2005年
13 唐业辉;许超;郭天宇;王云鹤;;多级卷积神经网络[A];第十二届全国信号和智能信息处理与应用学术会议论文集[C];2018年
14 郭天宇;朱铭健;王云鹤;许超;;基于自整合卷积神经网络的人脸分类算法[A];第十一届全国信号和智能信息处理与应用学术会议专刊[C];2017年
15 俞铁城;周健来;宋岩涛;;基于神经网络/隐马尔可夫模型的混合语音识别方法的研究现状[A];第五届全国人机语音通讯学术会议(NCMMSC1998)论文集[C];1998年
16 杨龙飞;解焱陆;张劲松;;基于卷积神经网络的发音偏误趋势检测[A];第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集[C];2017年
17 燕卫政;郑磊磊;陈巧珍;林铮;;多尺度卷积循环神经网络及其在抑郁症分类中的应用[A];2020年浙江省医学会精神病学学术大会浙江省医师协会精神科医师分会第十三届年会论文汇编[C];2020年
18 祁雪峰;张涛;甄国帅;王焱;毛宇;;基于共轭梯度法的线缆电磁串扰模式识别分析[A];第五届中国航空科学技术大会论文集[C];2021年
19 杨昊;彭阳;余芳强;许璟琳;;基于深度学习的用电大数据异常检测与修复[A];中国土木工程学会总工程师工作委员会2021年度学术年会暨首届总工论坛会议论文集[C];2021年
20 夏吉祥;李成;翟海亭;;基于神经网络的运动损伤估计模型[A];第十二届全国体育科学大会论文摘要汇编——墙报交流(体育工程分会)[C];2022年
中国博士学位论文全文数据库 前20条
1 张仕良;基于深度神经网络的语音识别模型研究[D];中国科学技术大学;2017年
2 马超;基于深度神经网络的三维目标检测与识别技术研究[D];国防科技大学;2019年
3 艾鹏程;基于卷积神经网络的高能物理事例特征信息在线提取算法研究[D];华中师范大学;2020年
4 朱晓宁;深度神经网络在图像识别中的研究与应用[D];北京邮电大学;2019年
5 吴雨;深度神经网络的特征融合机制及其应用研究[D];四川大学;2021年
6 毛博;基于卷积神经网络的地震数据重构与模型构建研究[D];吉林大学;2020年
7 金国强;基于深度学习的复杂工况下端到端的滚动轴承故障诊断算法研究[D];中国科学技术大学;2020年
8 张燕红;基于卷积神经网络的人脸识别研究[D];天津大学;2018年
9 高震宇;基于深度卷积神经网络的图像分类方法研究及应用[D];中国科学技术大学;2018年
10 曾宇骏;基于深度神经网络的智能车辆目标识别与学习控制方法研究[D];国防科技大学;2018年
11 周盼;基于深层神经网络的语音识别声学建模研究[D];中国科学技术大学;2014年
12 林绍辉;深度神经网络压缩与加速关键技术的研究[D];厦门大学;2019年
13 吴兵;基于深度神经网络的水墨画艺术风格生成与识别研究[D];上海大学;2020年
14 罗骜;基于图神经网络的场景理解算法研究[D];电子科技大学;2020年
15 殷翔;语音合成中的神经网络声学建模方法研究[D];中国科学技术大学;2016年
16 李蒙;基于深度小世界神经网络的风机变工况变桨故障诊断研究[D];北京交通大学;2020年
17 丁清扬;基于神经网络和关键结合模式的网络药理学方法及应用[D];清华大学;2020年
18 谢凌伟;基于神经网络的多属性药物分类方法研究[D];厦门大学;2019年
19 冯谢星;面向深度神经网络的数据增强和优化方法研究[D];湖南大学;2020年
20 容毅标;卷积神经网络在眼科医学图像中的应用研究:分类、分割及回归分析[D];苏州大学;2020年
中国硕士学位论文全文数据库 前20条
1 张建华;基于深度学习的语音识别应用研究[D];北京邮电大学;2015年
2 梁静;基于深度学习的语音识别研究[D];北京邮电大学;2014年
3 张玉凯;基于卷积神经网络的端到端语音识别研究[D];北京交通大学;2021年
4 刘秀秀;基于双向循环神经网络的藏语语音识别研究[D];青海师范大学;2020年
5 刘兵;基于深度卷积神经网络的图像检索算法研究[D];武汉科技大学;2017年
6 刘望;基于深度神经网络的轴承故障诊断方法研究[D];哈尔滨理工大学;2021年
7 曾晓双;基于深度学习的遥感图像云识别与分割处理技术研究[D];国防科技大学;2018年
8 黄鑫;基于卷积神经网络的旋转机械故障特征自动学习与智能诊断方法研究[D];重庆交通大学;2019年
9 吴潇翔;基于深度学习的智能电表用户分类研究[D];南昌大学;2021年
10 张亮亮;基于深度学习的人脸年龄估计算法[D];安徽工程大学;2020年
11 王桂芳;基于改进深度神经网络的特征提取方法研究[D];北京化工大学;2017年
12 时雪煜;基于回归神经网络的语音识别抗噪研究[D];中国科学技术大学;2016年
13 龚祺;基于卷积神经网络的量能器脉冲特征提取硬件系统设计[D];华中师范大学;2021年
14 周生伟;面向特征表示和分类的深度学习模型应用研究[D];扬州大学;2020年
15 王瀚晨;基于深度学习的模拟电路故障诊断研究[D];北方工业大学;2020年
16 宋叔飚;神经网络在语音识别中的应用研究[D];西北工业大学;2002年
17 刘雅彤;基于深度循环神经网络的语音识别算法研究[D];广东工业大学;2020年
18 董家仁;一种基于循环神经网络的语音识别算法研究与实现[D];广东工业大学;2020年
19 黄志东;基于深度卷积神经网络的藏语语音识别研究[D];青海师范大学;2020年
20 史晶;基于深度神经网络的语音情感识别模型研究[D];重庆大学;2019年
中国重要报纸全文数据库 前20条
1 记者 张梦然;神经网络打开理解电子相互作用新窗口[N];科技日报;2021年
2 记者 董映璧;神经网络技术检测玻璃钢缺陷精度高[N];科技日报;2020年
3 湖北日报全媒记者 张爱虎 通讯员 徐向军 实习生 于蓝;一群“90后”率先建成铁路“神经网络”[N];湖北日报;2019年
4 记者 刘霞;忆阻器制成神经网络更高效[N];科技日报;2017年
5 整理 本报记者 诸玲珍 顾鸿儒;微软神经网络切割法可使加速作用超线性[N];中国电子报;2018年
6 ;神经网络小史[N];电子报;2018年
7 ;人工智能将取得大面积突破[N];中国企业报;2017年
8 本报记者 龚丹韵;人机大战:人类还有优势吗[N];解放日报;2017年
9 ;人类正迎来云端机器人时代[N];中国企业报;2017年
10 记者 邱智丽;AI竞赛 中国力量崛起[N];第一财经日报;2017年
11 记者 刘霞;新神经网络使计算机像人一样推理[N];科技日报;2017年
12 本报记者 喻思娈;人工智能有多智能?[N];人民日报;2017年
13 记者 王雪青;构建机器世界神经网络 东土科技“抄底”人工智能[N];上海证券报;2017年
14 ;人工智能到底有多智能?[N];长白山日报;2017年
15 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年
16 记者 冯海波 通讯员 华轩;构建叠层宽度神经网络成深度模型[N];广东科技报;2021年
17 记者 毛黎;神经网络技术帮自主驾驶汽车识别幻影物体[N];科技日报;2020年
18 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年
19 本报首席记者 任荃 实习生 史博臻;轨交“神经网络”触动创新神经[N];文汇报;2011年
20 记者 张梦然;神经网络完成芯片设计仅需几小时[N];科技日报;2021年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978