收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

卷积神经网络研究及其在基音检测中的应用

黄志强  
【摘要】:卷积神经网络(Convolutional Neural Network, CNN)是一种源于人工神经网络(Neural Network, NN)的深度机器学习方法,近年来在图像识别领域取得了巨大的成功。CNN由于采用局部连接和权值共享,保持了网络的深层结构,同时又大大减少了网络参数,使模型具有良好的泛化能力又较容易训练。NN的训练算法是基于梯度下降的错误信号反向传播(Back Propagate, BP)算法,CNN的训练算法是BP算法的一种变形。本文从梯度下降的数学推导中总结了NN训练过程中的错误信号传播和权重修改策略,用切割小图训练共权神经网络的方式解释了CNN中的卷积过程,并以特殊卷积的方式解释了CNN的子采样过程,最后将NN的错误信号传播和权重修改策略移植到CNN的训练中。我们将推导出的CNN训练方法用C++编码实现,用CNN应用最早最典型的手写数字识别问题验证被编码的推导过程,得到了正确的效果。语音是人类生产生活中使用最为广泛的一种交流媒介,随着信息技术及移动互联网的发展与普及,语音被广泛用于智能人机交互领域。基音频率是语音信号处理技术中一个非常重要的语音参数。现实生活中,人们往往是在有噪声环境下进行语音交流,常用的基音提取方法在低信噪比环境下效果很差。本文深入分析了神经网络和卷积神经网络,并将其和传统基音检测方法结合,得到CNN_ACF_DP基音检测方法。该方法用ACF对语音文件算出一组基音判决信息,再用CNN算出一组基音判决信息,然后融合两组基音判决信息,最后在融合信息上使用基于语音短时平稳性的动态规划(Dynamic Programming,DP)求出基音序列。我们将CNN_ACF_DP方法与近年国际权威期刊上的PEFAC、Jin方法用相同的数据进行了对比实验。实验结果表明,我们的方法明显优于Jin方法,在某些数据上取得了比PEFAC更优的结果,总体性能与PEFAC方法相近。本文的方法在浊音识别错误率(VDE)和基音识别率(DR)两个指标上都明显优于Jin方法。在随机说话人随机噪声环境下VDE和DR指标略低于PEFAC, DR比PEFAC低1.34%,VDE比PEFAC高2.3%,但是本文方法对训练本文模型所使用的说话人的语音的VDE和DR两个指标都优于PEFAC, DR比PEFAC高0.8%,VDE比PEAFC低9.2%。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王都生,铁满霞,樊昌信;一种实时基音检测算法[J];电子学报;2000年10期
2 胡剑凌,徐盛,陈健;一种改进的基音检测算法[J];上海交通大学学报;2000年06期
3 由红,陈健;改进的频域基音检测算法[J];上海交通大学学报;2001年06期
4 赵建伟,楼红伟,徐大为,刘重庆;噪声环境下的基音检测方法[J];红外与激光工程;2002年01期
5 李香春,杜利民;一种基于多尺度边缘特征提取的基音检测算法[J];电子学报;2003年10期
6 彭辉,宁飞,孔宇;小波的提升方法在基音提取中的应用[J];山东大学学报(理学版);2003年01期
7 楼红伟,赵建伟,胡光锐;一种小波加权的基音检测方法[J];上海交通大学学报;2003年03期
8 朱君波,高瑞华,王守觉;一种基于能量对称度参数的实时基音检测方法[J];声学与电子工程;2003年04期
9 赵晓群,刘颖娜,武睿;基于形态滤波的基音检测新方法[J];通信学报;2004年05期
10 张天骐,张战,权进国,林孝康;语音信号基音检测的二次谱方法[J];计算机应用;2005年04期
11 张天骐;张战;林孝康;权进国;;一种语音信号基音检测的功率谱二次处理方法[J];计算机工程;2006年01期
12 董婧;赵晓晖;应娜;;基于二进小波变换的基音检测算法[J];吉林大学学报(工学版);2006年06期
13 马道钧;李鹏;余菲;;基音检测中帧长选择的分析[J];北京电子科技学院学报;2006年04期
14 陈小利;徐金甫;;小波变换与二次谱相结合的基音检测法[J];微计算机信息;2007年04期
15 王佑民;赵杰;江城;;从存在伴奏的歌曲中提取歌声基音的时域算法[J];电子工程师;2007年11期
16 张起贵;沈江峰;;一种实时基音检测算法[J];中北大学学报(自然科学版);2008年01期
17 朱建伟;孙水发;郑胜;万钧力;;一种基于段的基音检测算法[J];三峡大学学报(自然科学版);2008年03期
18 黄飞;李晶;栾爽;;一种有效的实时基音检测算法[J];电脑编程技巧与维护;2009年S1期
19 周俊;王立强;李波;韩桃;;基于改进二次谱基音检测的时长规整算法[J];无线电工程;2010年02期
20 朱建伟;孙水发;但志平;雷帮军;;改进的功率谱二次处理基音检测法[J];计算机工程与科学;2010年05期
中国重要会议论文全文数据库 前8条
1 黄鹤;鲍长春;;一种低延时坚韧的基音检测算法[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
2 林志钢;王长富;戴蓓倩;;基音检测的新方法[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 尹建琪;张涌;;无限精度语声基音提取[A];第二届全国人机语音通讯学术会议论文集[C];1992年
4 李宝利;景新幸;;小波分析在语音基音检测中的应用[A];中国声学学会2007年青年学术会议论文集(下)[C];2007年
5 关存太;陈永彬;;用编码器实现清浊判别和基音检测[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
6 谢晓桦;谢凌云;;基于曲线拟合系数的汉语声调判别方法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
7 胡波;肖熙;;一种新的检测语音端点及基音的概率模型及方法[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
8 刘洪涛;张保轩;;在PC机上实现的汉语话者确认系统[A];第四届全国人机语音通讯学术会议论文集[C];1996年
中国博士学位论文全文数据库 前1条
1 胡琦;基于计算听觉场景分析的单信道语言分离[D];北京交通大学;2014年
中国硕士学位论文全文数据库 前10条
1 黄志强;卷积神经网络研究及其在基音检测中的应用[D];内蒙古大学;2015年
2 王春娟;基于多窗谱和均值移动算法的基音检测研究[D];苏州大学;2015年
3 胡瑛;低信噪比下基音检测算法研究[D];中南大学;2007年
4 徐国钰;基于多小波的基音检测法及歌声的客观评价研究[D];广西师范大学;2006年
5 李仕涛;多基音检测算法研究[D];西安电子科技大学;2014年
6 焦蓓;语音信号的基音检测法研究[D];湘潭大学;2013年
7 郑瑞;基音检测算法研究及其在语音合成中的应用[D];南京师范大学;2014年
8 肖春梅;基于基音同步叠加方法的汉语语音合成处理研究[D];昆明理工大学;2014年
9 张营;基音特征提取算法的研究及其在语音门锁中的应用[D];吉林大学;2007年
10 许锦生;电子乐谱的设计与若干关键技术的实现[D];国防科学技术大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978