收藏本站
《南京邮电大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于人工神经网络模型的说话人转换算法研究

陈芝  
【摘要】:说话人转换是通过将一个说话人(源说话人)的语音个性特征转换成另一个说话人(目标说话人)的语音个性特征,而保持说话内容和情感特征不变的一门技术。经过转换后得到的声音要听起来像目标说话人的声音,同时保持源说话人的说话内容及情感特征不变。该技术具有重要的理论研究价值和良好的应用前景。本文主要围绕说话人转换中的基频轨迹转换和频谱包络参数转换这两项关键技术进行研究,主要工作和创新如下: (1)对目前已有的基频轨迹转换算法进行实验研究比较,发现目前的转换算法大多是简单的线性变换,而事实上两个说话人之间的基频轨迹是非线性映射关系。针对传统转换算法存在的问题(采用线性变换实现基频转换),提出基于RBF神经网络的基频轨迹转换算法,通过将基频轨迹分成等长的数据段,再分别对其进行建模,找出源和目标之间的映射规则,从而实现基频轨迹的转换。主客观测试表明:该算法既提高了特征参数转换的精确性,也增强了合成语音的自然度。 (2)传统的说话人转换算法都是将音段信息参数和超音段信息参数独立开来,分别进行转换,最后再一起合成转换语音。而越来越多的研究表明,两者之间隐藏着很大的关联性,可以从一个参数中提取出另一个参数的信息,将其独立开来分别转换的方法,势必会破坏两者之间的联系,影响转换后的效果。针对这一问题,提出将频谱信息参数和基音频率参数结合起来,组成短时联合谱参数,一起作为特征参数进行训练和转换。实验证明:改进后的转换效果均优于同等条件下的传统算法。 (3)通过对传统神经网络用于说话人转换算法的研究,发现影响神经网络转换效果的关键因素是隐含层的中心值和权值矩阵。对求解关键因素的算法加以改进,增强转换的精确性,势必会有效提高神经网络的转换效果,基于这样的分析,提出利用量子遗传算法优化神经网络,进而实现说话人转换。主客观实验的测试结果表明:基于改进算法得到的转换语音既提高了与目标语音之间的相似度,也增强了合成语音的清晰度。
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TN912.34

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 李秀芹;李小磊;孙娟;;XML模式与关系模式相互转换的研究[J];科技信息(学术研究);2007年10期
2 李秀芹;李小磊;孙娟;;XML模式与关系模式相互转换的研究[J];微型电脑应用;2007年09期
3 胡文彬;侯秀萍;臧成广;;基于XML的医院信息集成方法的研究与实现[J];淮海工学院学报(自然科学版);2008年03期
4 王昌达;杨文斌;鞠时光;;基于CES的电子病历签名系统研究与实现[J];计算机工程;2010年16期
5 张建生;张建华;蔡勇;;从UG模型到MCNP几何模型转换的改进算法研究与实现[J];计算机应用与软件;2010年11期
6 吕声,尹俊勋;同语种说话人转换的实现[J];移动通信;2004年S3期
7 杨勇,黎邦群;图书EAN码与ISBN号的互换算法[J];惠州学院学报;2005年05期
8 郑疆;柳青;张恒瑞;董朝;;一种分解树到形式化代码片断的转换算法[J];云南大学学报(自然科学版);2006年S2期
9 龙启铭;;ISBN升位后的转换算法[J];科技与出版;2007年01期
10 王行哲;;XML Schema到UML类图的转换方法[J];电脑知识与技术;2007年24期
中国重要会议论文全文数据库 前10条
1 林会杰;贾珈;王晓慧;蔡莲红;;基于B/S模式的3D双语虚拟说话人的研究与实现[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
2 吴敏玲;;くゐ·いく’‘~てくゐ·ていく’表动作空间范畴移动语言形式的日语语言特点——和汉语“来、去”、“~来、~去”比较[A];福建省外国语文学会2002年会论文集[C];2002年
3 刘大力;赵力;;与文本无关说话人识别系统的性能比较[A];2004年全国物理声学会议论文集[C];2004年
4 尹巧萍;赵力;;利用语音基音统计特征的说话人性别判识的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年
5 邓英;;基于说话人的对话语音分割[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
6 蒋冬梅;赵荣椿;;基于尺度描述的说话人归一化语音特征[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
7 周绍良;;修绠山房梓《宣和遗事》跋[A];水浒争鸣(第一辑)[C];1982年
8 李斌;陈小荷;;汉语褒贬词语的褒贬指向问题初探[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
9 王洪海;刘刚;郭军;;基于二次弯折函数的频率弯折方法[A];第二十六届中国控制会议论文集[C];2007年
10 艾妮;;谏劝中委婉格运用的“源”与“流”初探[A];江西省语言学会第五届会员大会暨2002年学术年会论文集[C];2002年
中国重要报纸全文数据库 前10条
1 ;美科学家要研制无声感应“手机”[N];新华每日电讯;2005年
2 张申 蔡莲红;富于表情的虚拟人脸合成[N];计算机世界;2007年
3 中国科学院自动化研究所模式识别国家重点实验室 于剑陶建华;个性化语音生成技术面面观[N];计算机世界;2007年
4 中国科学院自动化研究所模式识别国家重点实验室 辛乐陶建华;说话人头像技术:让语音可视[N];计算机世界;2007年
5 曹文彪;生气与高致[N];文学报;2006年
6 中国科学院自动化研究所模式识别国家重点实验室 周密陶建华;与电脑面谈[N];计算机世界;2007年
7 北京大学信息科学中心视觉与听觉信息处理国家重点实验室 吴玺宏;声纹识别听声辨人[N];计算机世界;2001年
8 刘喜喜;让视频会议多一些人工智能[N];中国计算机报;2008年
9 唐志强;不听别人说话,也能模仿其口音[N];新华每日电讯;2010年
10 秋水;挑吃“绿色” 敲响食品安全警钟[N];中国改革报;2006年
中国博士学位论文全文数据库 前10条
1 杨继臣;说话人信息分析及其在多媒体检索中的应用研究[D];华南理工大学;2010年
2 何俊;声纹身份识别中非常态语音应对方法研究[D];华南理工大学;2012年
3 潘逸倩;声纹密码技术研究[D];中国科学技术大学;2012年
4 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
5 冯哲;基于内容的视频检索中的音频处理[D];复旦大学;2004年
6 金乃高;音视频联合说话人定位与跟踪方法研究[D];大连理工大学;2008年
7 李泽海;数据仓库中多维数据处理与查询相关技术的研究[D];吉林大学;2005年
8 闵星雅;助动词“能”和“会”的认知研究[D];上海师范大学;2007年
9 李海辉;电视访谈中话语缓和的语用研究[D];广东外语外贸大学;2008年
10 祝东平;汉语时间感知模式与相关汉语因素研究[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 陈芝;基于人工神经网络模型的说话人转换算法研究[D];南京邮电大学;2011年
2 陆亮;多信道条件下的说话人认证[D];北京邮电大学;2010年
3 默盼;论宋代说话人[D];渤海大学;2012年
4 赵洪刚;基于对话型语音的说话人在线识别技术研究[D];黑龙江大学;2010年
5 李向格;关于“レてもぃぃ”与“レてぃぃ”的意义分析[D];吉林大学;2012年
6 黄雪莲;韩国语‘(?)’的话语功能分析[D];延边大学;2012年
7 张琪;复杂环境下特定说话人的语音识别研究[D];武汉纺织大学;2012年
8 凌锦雯;基于多特征的说话人分割与聚类的研究[D];中国科学技术大学;2011年
9 刘金福;基于关键词检出的说话人自适应技术研究[D];解放军信息工程大学;2004年
10 吴亮春;基于小波变换的说话人语音特征研究[D];西华大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026