收藏本站
《湖南大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

基于深度学习的语音识别控制系统研究

尹鑫  
【摘要】:近几年,智能终端的普及带动了智能家居行业的发展,同时伴随着人工神经网络理论的成熟,基于人工神经网络的深度学习为语音识别研究和应用提供了新的理论借鉴,因而将语音识别技术应用于家居控制系统使其更加智能化成为了可能。传统的语音识别技术主要采用的是模板匹配的方法,这种方法在孤立词的识别可以取得一定的效果,但是在大词汇连续语音的识别上,却难取得好的识别效果。由于神经网络可以模拟人类神经元的活动原理,具有较强的学习、联想、推理能力,所以基于深度学习的神经网络成为了目前语音识别研究的主要方向。本文详细介绍了语音识别和深度学习的基本原理,然后阐述如何将深度学习运用到语音识别中来提升识别系统的性能。1、研究了基于深度编码器改进的降噪栈式编码器传统的编码器采用的是三层网络结构也即输入层、隐含层、输出层,其中隐含层作为特征输出。在深度网络模型的理论基础上,对编码器进行改进,增加隐含层层数,使之达到5个,形成栈式编码器;同时为了使语音识别系统在真实环境中取得更好的效果,提升系统的鲁棒性,我们在第一个隐含层中引入噪声同时引入逐层贪婪训练算法,形成降噪栈式编码器。然后在MATLAB平台上搭建降噪栈式编码器模型,并对对降噪栈式编码器采用逐层贪婪算法进行训练,之后采用HTK语音开放平台对降噪栈式编码器模型提取出的语音特征与传统编码器的语音特征以及MFCC语音特征进行测试对比,实验结果证明了降噪栈式编码器提取出的特征值能够提升系统的识别率,进而提升系统的性能。2、基于深度学习的语音识别系统研究语音识别系统的设计中首先对控制系统的命令式的特性的进行分析,提出了基于动作(action)、对象(target)、操作(operation)模式的ATO语法模型。然后针对语音识别系统的各个模块进行研究和设计。声学基元采用根据汉语发音特色的声韵母基元配合音调进行建模;在对于声学模型的选择上,我们在对GMM-HMM和DNN-HMM进行对比分析后,得出,对于连续语音的识别,语音的数据量大,而DNN-HMM模型属于深度模型,对于复杂数据有着更好的拟合能力,因而选择DNN-HMM作为声学模型;最后对于解码器采用Token Passing Model算法的三层结构模型,最后在HTK上搭建语音识别器。从数据准备、声学模型的训练来搭建识别器。最后对识别器的性能进行评估并与传统的GMM-HMM模型进行对比,在识别率方面,达到了 66%的语句识别率,相比较GMM-HMM提升了 6.14%,证实了系统的可行性。3、智能家居中控制系统的语音控制器设计在语音识别系统研究的基础上,将其研究成果与智能家居控制的实际应用相结合,搭建语音控制器。设计语音控制器整体框架、系统流程,并对语音控制器进行性能测试,验证了语音控制器的可行性。
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN912.34

手机知网App
【参考文献】
中国期刊全文数据库 前5条
1 陈雷;杨俊安;王龙;李晋徽;;一种新的基于DBN的声学特征提取方法[J];无线电通信技术;2015年06期
2 王山海;景新幸;杨海燕;;基于深度学习神经网络的孤立词语音识别的研究[J];计算机应用研究;2015年08期
3 刘豫军;夏聪;;深度学习神经网络在语音识别中的应用[J];网络安全技术与应用;2014年12期
4 余凯;贾磊;陈雨强;徐伟;;深度学习的昨天、今天和明天[J];计算机研究与发展;2013年09期
5 张强;陶宏才;;基于HTK的语音识别语言模型设计及性能分析[J];成都信息工程学院学报;2009年02期
中国博士学位论文全文数据库 前1条
1 周盼;基于深层神经网络的语音识别声学建模研究[D];中国科学技术大学;2014年
中国硕士学位论文全文数据库 前10条
1 吴明辉;基于深度学习的与文本无关话者确认研究[D];中国科学技术大学;2016年
2 李鹏飞;基于深度学习的维语语音识别研究[D];安徽大学;2016年
3 张俊翕;智能家居自然语言处理算法的研究与实现[D];吉林大学;2016年
4 李博利;基于HTK大词汇量连续语音识别研究[D];云南大学;2016年
5 张德良;深度神经网络在中文语音识别系统中的实现[D];北京交通大学;2015年
6 孙兆;汉语语声特征的研究[D];北京邮电大学;2015年
7 张建华;基于深度学习的语音识别应用研究[D];北京邮电大学;2015年
8 张旭;基于深度神经网络的语音识别研究[D];新疆大学;2014年
9 雒玉玺;稀疏自动编码器及其加速算法的研究[D];兰州大学;2014年
10 崔建勇;快速稀疏编码器的研究及应用[D];大连理工大学;2014年
【共引文献】
中国期刊全文数据库 前10条
1 李轶南;张雄伟;李治中;吴海佳;孙久皓;;第1讲 深度学习:开启人工智能的新纪元[J];军事通信技术;2015年04期
2 范燕;吴小俊;邵长斌;宋晓宁;;基于PCA的GHA算法在BP网中的融合应用[J];计算机科学;2015年12期
3 石鑫;朱永利;;深度学习神经网络在电力变压器故障诊断中的应用[J];电力建设;2015年12期
4 毛存礼;余正涛;沈韬;高盛祥;郭剑毅;线岩团;;基于深度神经网络的有色金属领域实体识别[J];计算机研究与发展;2015年11期
5 陈珍;夏靖波;柏骏;徐敏;;基于进化深度学习的特征提取算法[J];计算机科学;2015年11期
6 郭平;王可;罗阿理;薛明志;;大数据分析中的计算智能研究现状与展望[J];软件学报;2015年11期
7 付伟;王金桥;滕可振;;基于深度学习的监控视频目标检索[J];无线电工程;2015年12期
8 黄海波;李人宪;杨琪;丁渭平;杨明亮;;基于DBNs的车辆悬架减振器异响鉴别方法[J];西南交通大学学报;2015年05期
9 王知音;禹龙;田生伟;钱育蓉;丁建丽;杨柳;;基于栈式自编码的水体提取方法[J];计算机应用;2015年09期
10 雷亚国;贾峰;周昕;林京;;基于深度学习理论的机械装备大数据健康监测方法[J];机械工程学报;2015年21期
中国博士学位论文全文数据库 前1条
1 王燕南;基于深度学习的说话人无关单通道语音分离[D];中国科学技术大学;2017年
中国硕士学位论文全文数据库 前10条
1 杨毫鸽;飞机发动机异常声音识别方法研究[D];南昌航空大学;2018年
2 耿鹏;目标明确的释放型操作示教与增强学习研究[D];中国科学院大学(中国科学院深圳先进技术研究院);2018年
3 陈力;基于凝视交互的虚拟汽车展示系统研究[D];西南交通大学;2018年
4 张艳;基于发音动作参数的说话人确认技术研究[D];上海师范大学;2018年
5 陈琛;基于深度学习CNN的滨海湿地高光谱遥感影像分类研究[D];国家海洋局第一海洋研究所;2018年
6 刘毓炜;基于智能终端的语音交互系统设计[D];北京邮电大学;2018年
7 宋志海;基于深度学习的课堂教学行为识别系统的研究与实现[D];北京邮电大学;2018年
8 张洪涛;基于深度学习的图像显著性检测方法研究[D];北京交通大学;2018年
9 张天作;基于FPGA的矩阵乘法实现方案在全连接深度神经网络前向传播中的性能评估[D];北京邮电大学;2018年
10 孙雅琳;人工智能在语言训练指导和批改中的应用[D];北京邮电大学;2018年
【二级参考文献】
中国期刊全文数据库 前9条
1 张开旭;周昌乐;;基于自动编码器的中文词汇特征无监督学习[J];中文信息学报;2013年05期
2 余凯;贾磊;陈雨强;徐伟;;深度学习的昨天、今天和明天[J];计算机研究与发展;2013年09期
3 孙志军;薛磊;许阳明;王正;;深度学习研究综述[J];计算机应用研究;2012年08期
4 张震南;;人工神经网络技术在语音识别中的应用[J];甘肃科技纵横;2008年04期
5 宋小鹏;潘宏侠;宋叔飚;;神经网络在语音识别中的应用[J];机械工程与自动化;2006年03期
6 孙宁;孙劲光;孙宇;;基于神经网络的语音识别技术研究[J];计算机与数字工程;2006年03期
7 史笑兴,顾明亮,王太君,何振亚;一种时间规整算法在神经网络语音识别中的应用[J];东南大学学报;1999年05期
8 陈国良,韩文廷;人工神经网络理论研究进展[J];电子学报;1996年02期
9 李苇营,易克初,胡征;神经网络与HMM构成的混合网络在语音识别中应用的研究[J];电子学报;1994年10期
中国博士学位论文全文数据库 前1条
1 李小兵;高效简约的语音识别声学模型[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 梁静;基于深度学习的语音识别研究[D];北京邮电大学;2014年
2 肖云鹏;子空间高斯混合模型在中文语音识别系统中的实现[D];北京交通大学;2013年
3 何小萍;改进的支持向量机分类算法在语音识别中的应用研究[D];太原理工大学;2013年
4 祝章伟;基于ZigBee网络的智能家居网关及终端节点设计与实现[D];吉林大学;2013年
5 周海云;基于隐马尔可夫模型的协议识别技术的研究[D];天津理工大学;2013年
6 周俊;基于HMM连续语音识别中关键技术的改进算法研究[D];上海师范大学;2012年
7 黄文龙;语音识别关键技术研究及系统实现[D];重庆大学;2010年
8 顾亚强;非特定人语音识别关键技术研究[D];国防科学技术大学;2009年
9 王冠雄;声学建模中若干问题的研究[D];北京邮电大学;2009年
10 王伟臻;基于神经网络的语音识别研究[D];浙江大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 姜姝姝;;语音识别64年大突破[J];机器人产业;2016年06期
2 吴俊宇;;语音识别为何“叫好不叫座”?[J];通信世界;2016年16期
3 徐鑫;;语音识别的未来之路[J];通信世界;2016年16期
4 张连仲;;带着使命感出发[J];英语学习;2017年01期
5 张凯;;荣威eRX5静态体验 “人性化”语音识别是亮点[J];新能源汽车新闻;2017年01期
6 刘宝华;;语音识别老祖宗[J];经营者(汽车商业评论);2017年03期
7 司马宁;;智能电视,语音识别或成突破口[J];消费指南;2017年05期
8 ;宝马 用科技打造“未来之家”[J];中国汽车市场;2016年11期
9 于海静;郭满库;;小学生单词语音识别技能培养研究[J];教师博览(科研版);2017年04期
10 林小春;江宇娟;刘帅;;语音识别,或是人工智能下一“风口”[J];晚霞;2017年06期
中国重要会议论文全文数据库 前10条
1 张冰;龙长才;罗海风;;熟悉掩蔽音背景下的目标语音识别[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
2 于东;贾磊;徐波;;面向语音识别错误恢复的澄清式疑问句生成[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 邢安昊;黎塔;颜永红;;利用二重打分方法的激活词语音识别[A];中国声学学会第十届青年学术会议论文集[C];2013年
4 文成义;何海燕;张玉扶;;基于新型神经网络的不定人语音识别[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年
5 杜笑平;杨启纲;杨家沅;;过零周期转移概率矩阵语音识别部件的研制[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年
6 潘胜昔;刘加;江金涛;王作英;陆大金;;基于多模式及集成判决的稳健电话语音识别算法研究[A];第五届全国人机语音通讯学术会议(NCMMSC1998)论文集[C];1998年
7 杜利民;;语音识别中的鲁棒性问题[A];第六届全国人机语音通讯学术会议论文集[C];2001年
8 宋君;葛余博;;应用于鲁棒语音识别的置信度加权特征丢失法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
9 张明新;倪宏;陈国平;张东滨;;一种用于并行模型噪声鲁棒语音识别的特征构造方法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
10 熊军军;马瑞堂;李成荣;;儿童语音识别的研究现状[A];第九届全国人机语音通讯学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 通讯员 魏霈侃;从学霸、学者到创业者的华丽转身[N];中国教育报;2016年
2 特约撰稿人 Lamont Wood 编译 Charles;语音识别成长起来,并走向移动应用[N];计算机世界;2018年
3 本报记者 陶力;阿里全资收购先声互联 推动语音识别场景落地[N];21世纪经济报道;2018年
4 洪蕾;阿里研发高工业噪声环境下语音识别及传输技术[N];中国信息化周报;2018年
5 本报记者 郭科;登月早已实现,同期启动的语音识别还在路上[N];科技日报;2018年
6 本报记者 王星平;语音识别商用尴尬 应用场景垂直化路有多远[N];中国企业报;2016年
7 本报记者 余建华;从“绿皮车时代”迈入“高铁时代”[N];人民法院报;2017年
8 陈宗周;机器在聆听[N];电脑报;2017年
9 本报记者 黄旭 熊雯琳;云知声:与巨头共舞,成为AI领域BAT的密码[N];电脑报;2017年
10 本报记者 钱一彬;手机“黑科技”为何叫好不叫座[N];人民日报;2017年
中国博士学位论文全文数据库 前10条
1 贺苏宁;基于语音识别基元声学整体结构特征的识别模型研究[D];电子科技大学;2005年
2 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
3 徐金甫;基于特征提取的抗噪声语音识别研究[D];华南理工大学;2000年
4 宁更新;抗噪声语音识别新技术的研究[D];华南理工大学;2006年
5 沈海峰;语音识别中的环境补偿研究[D];北京邮电大学;2006年
6 李小兵;高效简约的语音识别声学模型[D];中国科学技术大学;2006年
7 孙暐;听觉特性与鲁棒语音识别算法研究[D];东南大学;2006年
8 雷建军;噪声鲁棒语音识别中若干问题的研究[D];北京邮电大学;2007年
9 孙成立;语音关键词识别技术的研究[D];北京邮电大学;2008年
10 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 何晨山;语音识别软件影响汉英数字同传的实证研究[D];上海外国语大学;2018年
2 王杰;基于深度神经网络的语音识别研究[D];沈阳工业大学;2018年
3 王旭东;基于波束形成与DNN的远距离语音识别方法研究[D];辽宁工业大学;2018年
4 陈皇;基于神经网络的语音识别声学模型压缩研究[D];中国科学技术大学;2018年
5 许娟;改进的人工蜂群算法在语音识别中的应用研究[D];西安建筑科技大学;2018年
6 游浩;基于Easydarwin平台的视频应急通信软件设计与研究[D];上海师范大学;2018年
7 李莹莹;基于深度学习的工业机械手语音控制方法研究[D];华南理工大学;2018年
8 郝运;行为树驱动的人工智能决策模式设计与实现[D];中国科学院大学(中国科学院沈阳计算技术研究所);2018年
9 陈堆盛;随机深度网络在声学建模上的研究[D];华南理工大学;2018年
10 朱明星;车载噪声背景下的语音识别中减噪技术研究[D];安徽工业大学;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026