收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于HTK的个性化语音合成研究与实现

冯程程  
【摘要】:随着语音技术的不断进步,语音合成技术也有了非常显著的提高。语音合成的效果有了很大的改善,语音的可懂度和自然度也基本能够满足了人们的需求。然而用户对现有的语音合成系统也提出了更高的要求,尤其是对于个性化语音合成方面的需求。在这种背景下,个性化语音合成技术就具有了很高的理论研究和使用价值。 本文首先分析了不同语音产生的机理并对影响语音个性化的特征参数进行了详细的实验研究;并搭建了基于HTK(HMM-Tool-Kit)平台的英文语音合成系统,该语音合成系统的设计主要包含了语音库数据的预处理、基频参数和梅尔倒谱参数的隐马尔可夫模型(HMM)训练以及参数语音合成三部分;最后在该系统合成出来的语音基础上进行个性化特征参数调整,完成了个性化语音的合成。 本文的主要研究内容如下: (1)在分析语音合成原理以及当前常用语音合成算法的基础上,选取了基于HMM可训练语音合成算法来进行语音合成;设计了基于HTK的个性化语音合成系统框架,分析了个性化语音合成的难点以及本文研究的重点。 (2)从语音产生的机理分析了语音个性化产生的原因,以及不同语音参数对语音个性化产生的影响,在此基础上选取了对语音个性化影响较大的四个特征参数(时长、基频、能量、共振峰)分别进行了实验分析,得出各个参数的调整和变化对语音个性化产生的具体影响。 (3)在HTK语音合成系统设计当中,完成了语音合成的预处理工作,包括语料库的选取、语音库标注以及语音参数的提取;在模型训练过程中,解决了英文的上下文相关语法设计、问题集的设计以及基于决策树的模型聚类问题,并完成了合成系统的HMM训练;在语音合成阶段,完成了待合成语句的文本分析以及文本标注;最后在Unix环境下完成了基于HTK平台的英文语音合成。 (4)使用Praat软件对合成语音以及目标语音的四个主要个性化特征参数进行提取与分析,对比二者之间的差别。在此基础上,对合成语音的个性化特征参数进行调整和修改,合成出具有个性化特征的语音,并对个性化语音进行测评。本文采用的个性化语音合成方法增强了合成语音的个性化特征。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 罗三定,贾建华,沙莎;基于波形音频段处理的中文语音合成研究[J];电脑与信息技术;2002年01期
2 ;国内语音合成领域专利技术发展趋势[J];电子知识产权;2003年10期
3 王永生;柴佩琪;曾令平;;英语语音合成中基于约束树的音节切分算法[J];微型电脑应用;2005年11期
4 王仁华;戴礼荣;凌震华;胡郁;;基于统计建模的可训练单元挑选语音合成方法[J];科学通报;2009年08期
5 杨志晓;隋菲;张德贤;;基于可视语音合成的3D通信技术研究[J];计算机应用研究;2009年11期
6 高璐;陈琪;李永宏;于洪志;;藏语语音合成中文本分析的若干问题研究[J];西北民族大学学报(自然科学版);2010年02期
7 孙永欣;苏瑞;;具有TTS功能的同步朗读系统[J];自动化技术与应用;2011年06期
8 杨风健;;轻松学会语音合成[J];电子制作;2011年08期
9 郭淑妮;图雅;斯琴高娃;;蒙古语语音合成语料库的设计及韵律标注规范的建立[J];电脑与电信;2012年03期
10 曲珍;春燕;;藏语语音合成中语料数据标注规则的设计[J];西藏大学学报(自然科学版);2012年01期
11 张金溪;李照耀;肖俊生;李艾林;;面向语音合成的藏语音素切分算法研究[J];西北民族大学学报(自然科学版);2012年04期
12 赵建东;高光来;飞龙;;蒙古语语音合成语料库标注规则的设计[J];内蒙古大学学报(自然科学版);2013年03期
13 朱民雄;用视觉音素的语音合成[J];微机发展;1994年02期
14 何希才;杜煜;;语音合成原理及应用电路[J];集成电路应用;1994年02期
15 沪海;船用语音合成呼救系统[J];现代通信;1995年11期
16 彭惠娴,崔展望;一种汉语音节型语音合成模型[J];电路与系统学报;1996年02期
17 公保才让;;基于声韵母的藏语语音合成研究[J];信息与电脑(理论版);2014年01期
18 赵世霞,蔡莲红,常晓磊;汉语语音合成语料库管理系统的建立[J];小型微型计算机系统;2000年03期
19 陶建华,康永国;基于多元激励的高质量语音合成声学模型[J];中文信息学报;2004年03期
20 李海珠;说话时能播放背景音乐的语音合成芯片SC-691[J];国外电子元器件;2004年07期
中国重要会议论文全文数据库 前10条
1 杨静;孙金城;;关于录制语音合成数据库的几个问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
2 徐俊;蔡莲红;吴志勇;;多语种语音合成平台的设计与实现[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 陈益强;高文;王兆其;杨长水;姜大龙;;多模式语音合成[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 陶建华;董宏辉;许晓颖;;情感语音合成的关键技术分析[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
5 刘东华;冯静;力梅;;深圳市新一代“12121”语音合成业务系统[A];中国气象学会2007年年会气象软科学论坛分会场论文集[C];2007年
6 黄小明;熊子瑜;;基于古音系统的汉语方言语音合成研究[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
7 邹煜;何伟;侯敏;滕永林;朱维彬;;面向语音合成的新闻播报语音库构建及其特殊韵律结构[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 贺琳;张蕊;俞舸;;大规模语音合成语料库的录制及常见问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
9 陶建华;康永国;;基于多元激励的高质量语音合成声学模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
10 吴志勇;蔡莲红;蒙美玲;;可视语音合成中基于音视频关联模型的视位参数优化[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国博士学位论文全文数据库 前8条
1 高裴裴;人眼驱动语音合成的若干关键技术研究[D];南开大学;2012年
2 赵晖;真实感汉语可视语音合成关键技术研究[D];国防科学技术大学;2010年
3 苏庄銮;情感语音合成[D];中国科学技术大学;2006年
4 卢恒;基于统计模型与发音错误检测的语音合成方法研究[D];中国科学技术大学;2011年
5 雷鸣;统计参数语音合成中的声学模型建模方法研究[D];中国科学技术大学;2012年
6 凌震华;基于统计声学建模的语音合成技术研究[D];中国科学技术大学;2008年
7 杨辰雨;语音合成音库自动标注方法研究[D];中国科学技术大学;2014年
8 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
中国硕士学位论文全文数据库 前10条
1 聂军;基于HMM可训练的汉语语音合成系统[D];吉林大学;2010年
2 曾一鸣;情感语音合成的研究和系统实现[D];上海交通大学;2010年
3 刘航;基于隐马尔可夫模型的跨语种语音合成方法研究[D];中国科学技术大学;2011年
4 张桂香;个性化语音合成的研究与实现[D];哈尔滨工程大学;2007年
5 胡琼;基于隐马尔科夫模型的天津方言语音合成[D];上海交通大学;2011年
6 刘博;藏语拉萨方言的统计参数语音合成的研究[D];西北师范大学;2012年
7 吕斌;嵌入式语音合成及其关键算法的研究与实现[D];西安电子科技大学;2009年
8 吴振宇;个性特征的语音合成与模拟技术研究[D];华东师范大学;2011年
9 张鹏;汉语语音合成韵律控制方法与实现的研究[D];哈尔滨工程大学;2006年
10 鲁小勇;情感语音合成的研究[D];西北师范大学;2013年
中国重要报纸全文数据库 前10条
1 记者 桂运安;中科大11项语音合成指标世界第一[N];安徽日报;2014年
2 本报记者 何进伟;语音合成露峥嵘[N];网络世界;2001年
3 李羚;多语种语音合成助力数字奥运[N];中国计算机报;2003年
4 清华大学计算机系人机交互与媒体集成研究所 陶建华 蔡莲红;语音合成的应用系统设计[N];计算机世界;2001年
5 ;嵌入式语音合成平台[N];计算机世界;2002年
6 孙晓闻;语音合成 让机器“像人一样说话”[N];中国劳动保障报;2005年
7 ;新型语音合成软件面世[N];人民邮电;2008年
8 炎黄新星公司供稿;炎黄之声SinoSonic[N];计算机世界;2002年
9 刘权;语音合成融入证券客服[N];中国计算机报;2003年
10 ;语音产品走向开放式架构[N];中国计算机报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978