收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于LSTM网络和GMM的语音检测研究

郑慧贞  
【摘要】:哭声是婴儿特有的语言,是婴儿传递信息的一种重要方式,婴儿的哭声中蕴含着丰富的心理和生理需求信息,对婴儿哭声的研究可以帮助人们理解哭声的含义,实现对婴儿的更好的看护。本文的课题来源于某公司对婴儿哭声的分析需求,公司拟采集大量的婴儿哭声数据进行婴儿哭声分析,但是由于采集的哭声数据中常伴有成人的语音,出于对隐私保护的考虑,公司需将婴儿哭声音频流中的成人语音检测出来并有效去除。基于此,本文根据公司的需求,开展了基于LSTM网络、GMM模型和基于LSTM-GMM-RNN模型的语音检测研究,该研究分别基于LSTM网络、GMM模型和LSTM-GMM-RNN模型从音频流中识别出成人语音,其对用户隐私的保护具有重大的实际意义。本文以婴儿哭声分析为研究背景,围绕解决婴儿哭声数据采集过程中的隐私保护问题,开展成人语音检测研究,具体的研究工作包括:1)通过时域波形和语谱图分析了公司的婴儿哭声和成人语音数据库,通过听公司提供的掺杂有成人语音的婴儿哭声音频数据,总结了婴儿哭声和成人语音之间的信号差异,分析了有利于区分婴儿哭声和成人语音的音频特征。2)提取了MFCC、MFCC+energy、MFCC+pitch、PLP、PLP+energy共5组特征作为音频特征,实验搭建了包含2层LSTM网络结构的深度神经网络,以此神经网络为分类模型,分别基于上述每一组特征进行语音检测实验。3)基于GMM模型构造了三组不同的语音检测方案:基于婴儿哭声GMM模型的语音检测、基于成人语音GMM模型的语音检测、结合婴儿哭声GMM模型和成人语音GMM模型的语音检测。4)为了进一步提高语音检测准确率,提出通过RNN网络联合LSTM网络的识别结果和GMM模型的识别结果进行分类识别,提出了基于LSTM-GMM-RNN模型的语音检测算法,与基于LSTM网络的检测算法和基于GMM模型的检测算法相比,该算法的语音检测准确率有大幅度提高。本文提出的基于LSTM网络的语音检测算法、基于GMM模型的语音检测算法,以及基于LSTM-GMM-RNN的语音检测算法能很好地检测出婴儿哭声音频流中掺杂的成人语音,在去除成人语音后能很好地实现数据采集过程中对用户隐私的保护。


知网文化
【相似文献】
中国期刊全文数据库 前9条
1 陈亮;王震;王刚;;深度学习框架下LSTM网络在短期电力负荷预测中的应用[J];电力信息与通信技术;2017年05期
2 王国栋;韩斌;孙文赟;;基于LSTM的舰船运动姿态短期预测[J];舰船科学技术;2017年13期
3 周生强;;LSTM对上证指数的实证分析[J];现代经济信息;2017年09期
4 关鹏飞;李宝安;吕学强;周建设;;注意力增强的双向LSTM情感分析[J];中文信息学报;2019年02期
5 杜舒静;徐凡;王明文;;实体驱动的双向LSTM篇章连贯性建模[J];中文信息学报;2017年06期
6 保罗;郭旭琦;乔铁柱;阎高伟;;改进LSTM神经网络在磨机负荷参数软测量中的应用[J];中国矿山工程;2017年03期
7 季学武;费聪;何祥坤;刘玉龙;刘亚辉;;基于LSTM网络的驾驶意图识别及车辆轨迹预测[J];中国公路学报;2019年06期
8 陈卓;孙龙祥;;基于深度学习LSTM网络的短期电力负荷预测方法[J];电子技术;2018年01期
9 何立健;林穗;翁海瑞;;基于LSTM的图像生成诗歌模型[J];信息技术与网络安全;2019年04期
中国重要会议论文全文数据库 前9条
1 蒋振超;邓永;姜青山;古亮;;一种基于两阶段字符级LSTM的僵尸网络检测方法[A];第32次全国计算机安全学术交流会论文集[C];2017年
2 李鹏程;孙敏;庞溟舟;;基于LSTM神经网络的公交到站时间预测[A];第37届中国控制会议论文集(F)[C];2018年
3 朱佳晖;张文峰;刘卫平;张超;陈渊;;基于双向LSTM和CRF的军事命名实体识别和链接[A];第六届中国指挥控制大会论文集(上册)[C];2018年
4 刘天鹏;刘海;;基于LSTM的城市道路养护投诉量预测研究[A];中国公路学会养护与管理分会第九届学术年会论文集[C];2019年
5 安鹏;曹丹平;;基于LSTM循环神经网络的孔隙度预测方法研究[A];2018年中国地球科学联合学术年会论文集(二十九)——专题59:计算地球物理方法和应用、专题60:地热资源成因新理论与综合探测新技术[C];2018年
6 梅杰;;基于LSTM神经网络的有效停车泊位短时预测方法研究[A];创新驱动与智慧发展——2018年中国城市交通规划年会论文集[C];2018年
7 张宇;张鹏远;颜永红;;基于注意力LSTM和多任务学习的远场语音识别[A];第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集[C];2017年
8 牛溥华;高帆;张雪英;;基于DNN-LSTM的VAD算法[A];第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集[C];2017年
9 贾磊;;LSTM建模和CTC训练在语音建模技术中的应用[A];第十三届全国人机语音通讯学术会议(NCMMSC2015)论文集[C];2015年
中国硕士学位论文全文数据库 前10条
1 邓拓;基于LSTM神经网络的机场能见度预测[D];山东大学;2019年
2 郑慧贞;基于LSTM网络和GMM的语音检测研究[D];山东师范大学;2019年
3 杜心;基于LSTM神经网络的可用停车位预测模型研究[D];武汉理工大学;2018年
4 李永帅;基于双向LSTM的动态情感词典构建方法研究及文本情感分析[D];郑州大学;2019年
5 闫泽杭;基于互助双向LSTM与递进解码机制的图像标题生成[D];大连理工大学;2018年
6 李少鹏;结合CNN和LSTM的滚动轴承剩余使用寿命预测方法研究[D];哈尔滨理工大学;2019年
7 肖爽;基于LSTM的无人驾驶有轨电车安全评测方法研究[D];西安理工大学;2019年
8 周楚杰;基于LSTM和TCN混合深度学习的风速短期预测模型[D];兰州大学;2019年
9 甄远涛;基于深度学习LSTM神经网络的障碍可转债设计与定价[D];兰州财经大学;2019年
10 马艺翔;深度学习在多因子选股交易中的应用研究[D];北方工业大学;2019年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978