收藏本站
《西安建筑科技大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于个性声学特征的语音转换算法研究

赵渊  
【摘要】:语音转换是在维持原本说话者语音的含义不变的情形下,将其个性特征转换为目标说话者的个性特征,然后进行合成,使其与目标说话者的声音相似。本文主要是在研究个性声学特征的基础上,对传统的语音转换方法在转换中存在的不足进行改进和优化,具体内容有:1)由于高斯混合模型在对语音个性特征进行转换时,容易出现谱包络过平滑问题,对此文中提出一种将高斯混合模型(Gaussian Mixture Model,GMM)和广义回归神经网络(Generalized Regression Neuron Network,GRNN)相融合的语音转换模型。运用GRNN的非线性逼近能力将GMM模型参数集中的均值矢量进行映射,然后与GMM模型形成的转换规则中的均值矢量进行替换,得到新的映射关系。同时对韵律特征基频参数也进行转换,然后将频谱参数和基频参数进行联立转换,然后合成目标语音。最后通过实验仿真和性能测试表明:该方法有效的改善了转换中的过平滑问题,相比传统的GMM模型该方法转换后语音的质量更好,失真更少。2)针对粒子群算法优化广义回归神经网络对语音特征进行转换时容易产生局部收敛的问题。提出采用一种新的量子粒子群算法(Quantum Particle Swarm Optimization,QPSO)优化GRNN网络的语音转换模型。该算法通过改变相位进而改变位置矢量,同时加入变异操作,有效的克服了局部收敛。因此首先利用量子粒子群对网络进行优化得到最佳的光滑因子参数,从而建立频谱映射规则。接着,利用频谱参数和基频参数的相关性,对韵律特征基频也进行转换,然后利用STRAIGHT模型进行合成。最后通过实验仿真和性能测试表明:与传统粒子群算法优化广义回归神经网络相比,该方法转换后语音的自然度和相似度得到提升,谱失真率下降。文中提出的方法具有比RBF神经网络、GRNN模型、粒子群算法优化广义回归神经网络更好的语音转换性能。
【学位授予单位】:西安建筑科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.3

【参考文献】
中国期刊全文数据库 前9条
1 王民;赵渊;刘利;许娟;;基于量子粒子群优化广义回归神经网络的语音转换方法[J];液晶与显示;2018年02期
2 肖斌卿;颜建晔;杨旸;张璞;;金融安全预警系统的建模与实证研究:基于中国数据的检验[J];国际商务(对外经济贸易大学学报);2015年06期
3 张玲华;姚绍芹;解伟超;;基于自适应粒子群优化径向基函数神经网络的语音转换[J];数据采集与处理;2015年02期
4 王丽娜;高宪文;刘潭;;基于LPV模型GRNN输气管道音波定位算法[J];东北大学学报(自然科学版);2013年09期
5 王戡;郑玲;刘非;;基于广义回归神经网络的磁流变减振器模型辨识[J];汽车工程;2013年07期
6 汪灵枝;罗朝晖;韦增欣;赵秋梅;;量子粒子群优化神经网络集成股市预测模型研究[J];广西科学;2010年04期
7 张炳;俞一彪;;基于改进GMM和韵律联合短时谱的说话人转换[J];信号处理;2009年04期
8 李士勇;李盼池;;求解连续空间优化问题的量子粒子群算法[J];量子电子学报;2007年05期
9 康永国;双志伟;陶建华;张维;;基于混合映射模型的语音转换算法研究[J];声学学报;2006年06期
中国博士学位论文全文数据库 前1条
1 计哲;低速率语音编码算法研究[D];清华大学;2011年
中国硕士学位论文全文数据库 前10条
1 杨秀峰;基于神经网络的语音转换算法研究[D];西安建筑科技大学;2017年
2 叶伟;超帧特征空间下基于深度置信网络的语音转换[D];苏州大学;2016年
3 王明明;基于GMM和码本映射相结合的语音转换方法研究[D];西安建筑科技大学;2015年
4 李健;基于GMM的汉语语音转换系统研究[D];云南大学;2015年
5 姚绍芹;基于声道谱参数的语音转换算法研究[D];南京邮电大学;2015年
6 陈先同;语音转换中特征参数及其转换方法的研究[D];南京邮电大学;2015年
7 郑珩;基于MFCC和GMM语音转换技术研究[D];南京理工大学;2015年
8 朱春雷;优化自适应非平行训练语音转换算法研究[D];苏州大学;2013年
9 何彬;基于语音识别和语音合成的汉语语音转换技术研究[D];云南大学;2013年
10 程利;说话人语音转换技术研究[D];武汉纺织大学;2012年
【共引文献】
中国期刊全文数据库 前10条
1 周健;窦云峰;刘荣敏;王华彬;陶亮;;采用低维特征映射的耳语音向正常音转换[J];声学学报;2018年05期
2 陈晓敏;王家伟;;基于混合粒子群算法的列车停站方案优化[J];计算机系统应用;2018年06期
3 王民;杨秀峰;要趁红;;基于PSO优化GRNN的语音转换方法[J];计算机工程与科学;2018年04期
4 王民;赵渊;刘利;许娟;;基于量子粒子群优化广义回归神经网络的语音转换方法[J];液晶与显示;2018年02期
5 邓士杰;苏续军;唐力伟;张英波;;Multi-state Information Dimension Reduction Based on Particle Swarm Optimization-Kernel Independent Component Analysis[J];Journal of Donghua University(English Edition);2017年06期
6 朱湘临;凌婧;王博;郝建华;丁煜函;;基于改进PSO-RBFNN的海洋蛋白酶发酵过程软测量[J];化工学报;2018年03期
7 沈惠玲;万永菁;;一种基于预测谱偏移的自适应高斯混合模型在语音转换中的应用[J];华东理工大学学报(自然科学版);2017年04期
8 刘永俊;张立飞;刘巍;;面向噪声环境下医疗语音信号端点检测方法[J];常熟理工学院学报;2017年04期
9 陆凤岭;张心光;;高速铣削工件表面粗糙度预测建模[J];上海工程技术大学学报;2017年02期
10 陈昭晖;倪一清;;磁流变阻尼器非参数化模型泛化能力的提高[J];振动与冲击;2017年06期
中国博士学位论文全文数据库 前2条
1 何伟俊;基于感知的低速率语音编码算法研究[D];华南理工大学;2016年
2 江亮亮;三维网格模型和网络语音质量评估技术研究[D];西安电子科技大学;2015年
中国硕士学位论文全文数据库 前10条
1 许娟;改进的人工蜂群算法在语音识别中的应用研究[D];西安建筑科技大学;2018年
2 赵渊;基于个性声学特征的语音转换算法研究[D];西安建筑科技大学;2018年
3 窦云峰;基于特征映射的耳语音转换为正常语音的研究[D];安徽大学;2018年
4 洪涛龙;基于Android平台的图像文字识别及语音播放系统[D];南京邮电大学;2017年
5 崔立梅;基于改进的GMM和频率弯折的高质量语音转换算法的研究[D];南京邮电大学;2017年
6 赵东源;LKJ与音视频联动分析系统的设计与实现[D];郑州大学;2017年
7 杨秀峰;基于神经网络的语音转换算法研究[D];西安建筑科技大学;2017年
8 王萌;说话人识别算法研究[D];广东工业大学;2017年
9 苏利博;采用STRAIGHT模型和深度信念网络的语音转换方法[D];西安建筑科技大学;2016年
10 惠琳;谱参数联合韵律特征实现年龄语音转换的研究[D];苏州大学;2016年
【二级参考文献】
中国期刊全文数据库 前10条
1 张国梁;贾松敏;张祥银;徐涛;;采用自适应变异粒子群优化SVM的行为识别[J];光学精密工程;2017年06期
2 张玲华;姚绍芹;解伟超;;基于自适应粒子群优化径向基函数神经网络的语音转换[J];数据采集与处理;2015年02期
3 王洪涛;李丹;;基于改进粒子群算法的图像边缘检测研究[J];液晶与显示;2014年05期
4 姚绍芹;张玲华;;基于GMM和ANN混合模型的语音转换方法[J];数据采集与处理;2014年02期
5 郭莹莹;;国内外金融危机预警模型述评[J];科学决策;2013年10期
6 郭通;兰巨龙;李玉峰;江逸茗;;基于量子自适应粒子群优化径向基函数神经网络的网络流量预测[J];电子与信息学报;2013年09期
7 张志成;林君;石要武;王勇;;用加权子空间拟合和量子粒子群算法联合估计多普勒频率和波达方向[J];光学精密工程;2013年09期
8 许争;戚新;;地方政府性债务风险预警研究——基于东北地区某市的经验数据[J];科学决策;2013年08期
9 程棵;魏先华;杨海珍;杨晓光;;金融危机对金融机构的冲击及政府救助分析[J];管理科学学报;2012年03期
10 李红继;韩琳;;我国金融安全评价指标体系构建及综合评价方法选择[J];现代财经(天津财经大学学报);2011年05期
中国硕士学位论文全文数据库 前10条
1 苏利博;采用STRAIGHT模型和深度信念网络的语音转换方法[D];西安建筑科技大学;2016年
2 牛志娟;基于人工神经网络预测与分类的应用研究[D];中北大学;2016年
3 叶伟;超帧特征空间下基于深度置信网络的语音转换[D];苏州大学;2016年
4 王泽勋;多层次韵律和短时谱同步变换的情感语音合成[D];苏州大学;2015年
5 车滢霞;约束条件下的结构化统计声学模型及非平行语料语音转换[D];苏州大学;2015年
6 陈先同;语音转换中特征参数及其转换方法的研究[D];南京邮电大学;2015年
7 解奉龙;基于神经网络的语音转换[D];哈尔滨工业大学;2014年
8 赵莽;语音个性特征识别及转化系统研究[D];南京大学;2014年
9 刘廷廷;语音转换的研究[D];河北科技大学;2014年
10 朱春雷;优化自适应非平行训练语音转换算法研究[D];苏州大学;2013年
【相似文献】
中国期刊全文数据库 前10条
1 苏小诗;;关于语音训练对英语水平提升程度的探究[J];新课程(下);2017年04期
2 金萍;;幼儿一日活动中的语音教育[J];贵州教育;2017年07期
3 段晶晶;;腭裂患儿术后语音训练与健康教育[J];护理研究;2007年20期
4 石春兰,安静敏,杜秋爽;腭裂术后语音训练的效果观察[J];现代口腔医学杂志;2005年02期
5 陈卫民,冀予心,朱声荣,陶学金,马净植;腭裂修复术后语音训练介入时机的研究[J];中华物理医学与康复杂志;2004年04期
6 王汉君;声乐教学中语音训练之我见[J];内蒙古艺术;2004年01期
7 张兰娥,郭秀丽;腭裂术后病人语音训练的健康教育[J];护理研究;2003年S1期
8 李英姿,朱影,赵玉巧,田兰松;300例腭裂病人术后语音训练效果观察[J];护理研究;2001年04期
9 殷文珍,林作华;先天性上腭裂修复的语音训练[J];现代康复;2001年09期
10 石文岚;腭裂术后语音训练策略[J];护理学杂志;2000年06期
中国重要会议论文全文数据库 前6条
1 杨永懿;陈仁吉;;电子鼻咽镜指导边缘性腭咽闭合患者语音训练的体会[A];第七届全国唇腭裂学术会议论文集[C];2009年
2 史炜琪;马婕;;舌癌患者术后语音康复训练治疗[A];全国口腔科护理学术交流暨专题讲座会议论文汇编[C];2005年
3 靳利敏;李峰;翟英;付坤;;咳痰诱导法在腭裂术后舌根音发音矫正中的应用[A];2012年河南省五官科优质服务护理管理与专科护士培养学术研讨会论文集[C];2012年
4 靳利敏;李新明;李峰;翟瑛;付坤;;咳痰诱导法在腭裂术后舌根音发音矫正中的应用[A];河南省五官科专科护士培养及岗位管理学术会议论文集[C];2013年
5 孙悦;张劲松;解焱陆;曹文;;日本学生汉语阳平和上声的知觉训练——训练效果的初步分析[A];需将论文集名称修改为“第十二届全国人机语音通讯学术会议(NCMMSC2013)论文集[C];2013年
6 张淑英;王秋莉;王静;;儿童腭裂序列治疗中的社会心理护理和语音教育[A];全国口腔科护理学术交流暨专题讲座会议论文汇编[C];2006年
中国重要报纸全文数据库 前7条
1 刘柳;患儿腭裂术后语音训练[N];医药养生保健报;2008年
2 黄明明;语音训练中的“矫枉过正”[N];语言文字周报;2005年
3 山东 周少军;Web-TalkIt让浏览器听你的指挥[N];电脑报;2001年
4 江苏 副主任医师 邹继军 昊叶青;先天性唇腭裂语音训练[N];家庭医生报;2015年
5 宋志明;君子动口不动手[N];中国电脑教育报;2003年
6 ;软件应用问答(一)[N];中国计算机报;2004年
7 本报记者 曹继军 颜维琦;在均衡基础上追求优质[N];光明日报;2011年
中国博士学位论文全文数据库 前1条
1 徐静波;语音时频及非线性增强处理方法研究[D];解放军信息工程大学;2005年
中国硕士学位论文全文数据库 前10条
1 胡明芳;学龄前腭裂术后患儿辅音的构音特点及语音训练[D];郑州大学;2018年
2 赵渊;基于个性声学特征的语音转换算法研究[D];西安建筑科技大学;2018年
3 巫小兰;对感冒语音鲁棒的语音指令识别及嵌入式实现[D];华南理工大学;2018年
4 亚尔肯·阿吉;基于隐马尔科夫模型的维吾尔语腭裂患者术后语音理解度自动评估研究[D];新疆医科大学;2017年
5 王正昊;腭裂术后患儿语音训练前后普通话塞音的强频集中区频率及冲直条分析[D];广西医科大学;2015年
6 马霄;手掌模式语音训练法在大学英语听力教学中的应用研究[D];内蒙古师范大学;2015年
7 徐丽娜;学龄后功能性构音障碍患者辅音的语音特点及语音训练[D];郑州大学;2017年
8 黄诚诚;基于汉语语音分析的聋哑儿童语音训练康复系统的设计与开发[D];暨南大学;2015年
9 舒颖;基于语音识别技术的英语语音训练实证性研究[D];浙江财经大学;2018年
10 高楠;腭裂术后患者舌尖音构音异常的语音特点及语音训练[D];郑州大学;2016年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026