收藏本站
《中国科学技术大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于统计声学建模的语音合成技术研究

凌震华  
【摘要】: 近十几年来,随着针对语音信号的统计建模方法的日益成熟以及参数合成器性能的不断提升,统计参数语音合成(Statistical Parametric Speech Synthesis)思想被提出,并得到了越来越多研究者的关注。其中,以基于隐马尔可夫模型(Hidden Markov Model,HMM)的参数语音合成方法为代表,该方法已逐步发展成为和基于语料库的单元挑选与波形拼接合成方法相并列的一种主流语音合成方法。相比传统的单元挑选与波形拼接合成方法,基于HMM的参数语音合成方法具有合成语音流畅度高、鲁棒性好,系统构建速度快、自动化程度高,系统尺寸小、灵活度高等优点。 本文以统计声学模型在语音合成中的应用为研究重点,在原有基于HMM的参数合成方法之外,提出了两种新的基于统计声学建模的语音合成方法。第一,基于HMM的单元挑选与波形拼接合成:我们将HMM参数语音合成中使用的声学参数建模思想,与传统的单元挑选与波形拼接合成方法相结合,使用概率准则指导最优单元搜索,通过拼接波形生成最终语音,以克服参数合成方法在生成语音音质上的不足,提高合成语音的自然度;第二,融合声学参数与发音器官参数(Articulatory Feature)的建模与合成:我们在声学参数之外,引入和语音产生机理更加紧密相关的发音器官参数,通过对原有的HMM模型结构进行改进,实现两种参数的联合建模与生成,从而提高合成时声学参数预测的精确度和灵活性。 整篇文章的安排如下: 第1章是绪论,将回顾语音合成的发展历史,并对常见的几种语音合成方法进行简要的介绍。 第2章将具体介绍基于HMM的参数语音合成方法,包括HMM的基本原理、系统框架、关键技术点等,并通过对此方法特点的分析,阐明我们进行新的语音合成方法研究的动机与出发点。 第3章将重点介绍基于HMM的单元挑选与波形拼接语音合成算法。首先我们提出了使用HMM进行单元挑选的两种不同的实现形式,一种以帧为拼接单元,基于最大似然准则实现单元搜索,另一种使用音素和帧的两级拼接单元,结合似然值准则和Kullback-Leibler距离(Kullback-Leibler Divergence,KLD)进行单元选择;然后,我们归纳出了基于HMM的单元挑选合成的统一算法框架,并通过在中文和英文合成系统上的测试证明了此算法的有效性;最后,我们提出了最小单元挑选错误(Minimum Unit Selection Error,MUSE)准则,用以替代原有HMM训练中使用的最大似然准则,实现了合成系统的全自动构建,并进一步提高了合成语音的自然度。 第4章将介绍融合发音器官参数与声学参数的统计建模与合成。这里的“发音器官参数”指的是对发音过程中说话者舌、唇、下颚等发音器官的位置以及运动情况的定量描述。在阐明了引入发音器官参数的原因以及对原有系统框架进行了简单回顾后,我们提出了对声学参数和发音器官参数进行联合建模与参数生成的总体思路,并且从模型聚类策略、状态的同步性假设以及特征之间的独立性假设三个方面,讨论了几种可能的模型结构;然后,通过一系列的客观和主观评测,证明了这种结合发音器官参数的系统构建方法在提高声学参数预测的精确度和灵活性方面的有效性。 第5章对全文进行了总结。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:TN912.33

手机知网App
【引证文献】
中国期刊全文数据库 前3条
1 张斌;全昌勤;任福继;;语音合成方法和发展综述[J];小型微型计算机系统;2016年01期
2 于延锁;朱风云;李先刚;刘翼;吴玺宏;;面向大语料库的语音合成方法研究[J];北京大学学报(自然科学版);2014年05期
3 杨峰;邵鹏飞;王玉芳;李爱军;;基于LVQ网络的普通话和广东普通话的韵律模式分类[J];山东师范大学学报(自然科学版);2009年02期
中国博士学位论文全文数据库 前2条
1 蔡明琦;融合发音机理的统计参数语音合成方法研究[D];中国科学技术大学;2015年
2 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
中国硕士学位论文全文数据库 前10条
1 沙文;基于音高的歌声美化系统的研究[D];中国科学技术大学;2016年
2 李焕君;个性化语音合成在船舶导航系统中应用研究[D];大连海事大学;2016年
3 宋阳;基于统计声学建模的单元挑选语音合成方法研究[D];中国科学技术大学;2014年
4 章琴;基于HMM的中文情感语音合成的研究[D];合肥工业大学;2014年
5 熊林云;基于ARM Cortex-M3的语音合成软件系统设计与实现[D];电子科技大学;2014年
6 宋文龙;基于说话人自适应训练的统计参数语音合成的研究[D];西北师范大学;2013年
7 胡恩星;越南语文语转换系统中的前端文本分析方法[D];云南大学;2013年
8 杨忠山;基于VQ/HMM的强对流天气识别方法研究[D];天津大学;2012年
9 帕丽旦·木合塔尔;基于HMM的维吾尔语可训练语音合成文本分析关键技术研究[D];新疆大学;2012年
10 刘博;藏语拉萨方言的统计参数语音合成的研究[D];西北师范大学;2012年
【参考文献】
中国博士学位论文全文数据库 前1条
1 吴义坚;基于隐马尔科夫模型的语音合成技术研究[D];中国科学技术大学;2006年
【共引文献】
中国博士学位论文全文数据库 前9条
1 柳雪飞;疑问代词句的语音与句法接口研究[D];中国社会科学院研究生院;2016年
2 蔡明琦;融合发音机理的统计参数语音合成方法研究[D];中国科学技术大学;2015年
3 杨辰雨;语音合成音库自动标注方法研究[D];中国科学技术大学;2014年
4 余明朗;面向景区智能导游的室内外一体化定位及位置服务方法研究[D];南京师范大学;2013年
5 田亚男;视频输入听觉显示的导盲系统关键技术研究[D];东北大学;2013年
6 雷鸣;统计参数语音合成中的声学模型建模方法研究[D];中国科学技术大学;2012年
7 孙颖;情感语音识别与合成的研究[D];太原理工大学;2011年
8 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
9 凌震华;基于统计声学建模的语音合成技术研究[D];中国科学技术大学;2008年
【同被引文献】
中国期刊全文数据库 前10条
1 陈志杰;王韦皓;;情感语音发音机理的研究[J];长春教育学院学报;2014年24期
2 戴礼荣;张仕良;;深度语音信号与信息处理:研究进展与展望[J];数据采集与处理;2014年02期
3 韩文静;李海峰;阮华斌;马琳;;语音情感识别研究进展综述[J];软件学报;2014年01期
4 王敬华;刘建银;张国燕;赵新想;;情感语音合成中韵律参数的基频研究[J];小型微型计算机系统;2013年09期
5 井晓阳;罗飞;王亚棋;;汉语语音合成技术综述[J];计算机科学;2012年S3期
6 倪崇嘉;张爱英;刘文举;;基于声学相关特征与词典语法相关特征的汉语重音检测[J];计算机学报;2011年09期
7 章森;刘磊;刁麓弘;;大规模语音语料库及其在TTS中应用的几个问题[J];计算机学报;2010年04期
8 朱维彬;;语音合成中的语言学计算模型:现状及展望[J];当代语言学;2009年02期
9 杨峰;武鲁英;杨勇;周国亮;刘方;;基于空间域和变换域的双水印算法的研究[J];山东师范大学学报(自然科学版);2008年02期
10 蔡莲红;崔丹丹;蔡锐;;汉语普通话语音合成语料库TH-CoSS的建设和分析[J];中文信息学报;2007年02期
中国博士学位论文全文数据库 前3条
1 雷鸣;统计参数语音合成中的声学模型建模方法研究[D];中国科学技术大学;2012年
2 凌震华;基于统计声学建模的语音合成技术研究[D];中国科学技术大学;2008年
3 吴义坚;基于隐马尔科夫模型的语音合成技术研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 刘涛;安全监视与综合报警系统的设计与实现[D];大连海事大学;2015年
2 任燚;基于ECDIS的船舶自动控制仿真研究[D];大连海事大学;2014年
3 赵莽;语音个性特征识别及转化系统研究[D];南京大学;2014年
4 庄延峰;语音控制技术在船舶导航系统中的应用研究[D];大连海事大学;2013年
5 宋文龙;基于说话人自适应训练的统计参数语音合成的研究[D];西北师范大学;2013年
6 鲁小勇;情感语音合成的研究[D];西北师范大学;2013年
7 李娜;麦克风自适应算法在鲁棒语音合成中的研究[D];中国海洋大学;2013年
8 张志楠;语音Corpus的自动构建和语音最小化标注的研究[D];中国海洋大学;2013年
9 熊艳娇;基于HMM的发音人转换系统[D];云南大学;2013年
10 任鹏辉;情感语音合成系统的研究与实现[D];太原理工大学;2013年
【二级引证文献】
中国硕士学位论文全文数据库 前10条
1 杨国菁;城市轨道交通乘客出行行为多样性研究[D];北京交通大学;2016年
2 李冰洁;基于声韵母的嵌入式语音合成[D];北京交通大学;2016年
3 李焕君;个性化语音合成在船舶导航系统中应用研究[D];大连海事大学;2016年
4 胡湘兴;面向文语转换的傣语文本归一化和罗马化[D];云南大学;2015年
5 谢更高才旦;玛曲弹唱口传文化的声学特征分析[D];西北民族大学;2015年
6 徐世鹏;藏语统计参数语音合成的合成语音的音质评测[D];西北师范大学;2015年
7 冯欢;基于HMM的歌词到歌声转换的研究[D];西北师范大学;2015年
8 王振文;汉藏双语跨语言语音转换方法的研究[D];西北师范大学;2015年
9 潘晓凤;基于Xface的藏语TTVS的实现[D];西北师范大学;2015年
10 侯亭武;基于语料库的中文语音合成技术研究[D];华中科技大学;2015年
【相似文献】
中国期刊全文数据库 前10条
1 周海涛;;语音合成中多音字识别的实现[J];科技资讯;2008年11期
2 彭腾;孙萍;;基于C#语音合成的实现[J];电脑编程技巧与维护;2010年12期
3 张世平;;会说四种话的语音合成卡——声威一号[J];今日电子;1993年01期
4 赵建洋;;一种高效语音合成方法[J];电子技术;1993年08期
5 马义德,张新国,罗长印;语音合成电路在我国的应用前景[J];电子技术;1994年12期
6 郝杰;语音合成:引领“耳朵经济”[J];中国电子商务;2001年Z2期
7 罗三定,贾建华,沙莎;基于波形音频段处理的中文语音合成研究[J];电脑与信息技术;2002年01期
8 ;国内语音合成领域专利技术发展趋势[J];电子知识产权;2003年10期
9 周洁,赵力,邹采荣;情感语音合成的研究[J];电声技术;2005年10期
10 王永生;柴佩琪;曾令平;;英语语音合成中基于约束树的音节切分算法[J];微型电脑应用;2005年11期
中国重要会议论文全文数据库 前10条
1 杨静;孙金城;;关于录制语音合成数据库的几个问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
2 徐俊;蔡莲红;吴志勇;;多语种语音合成平台的设计与实现[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 陈益强;高文;王兆其;杨长水;姜大龙;;多模式语音合成[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 陶建华;董宏辉;许晓颖;;情感语音合成的关键技术分析[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
5 刘东华;冯静;力梅;;深圳市新一代“12121”语音合成业务系统[A];中国气象学会2007年年会气象软科学论坛分会场论文集[C];2007年
6 黄小明;熊子瑜;;基于古音系统的汉语方言语音合成研究[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
7 邹煜;何伟;侯敏;滕永林;朱维彬;;面向语音合成的新闻播报语音库构建及其特殊韵律结构[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 贺琳;张蕊;俞舸;;大规模语音合成语料库的录制及常见问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
9 陶建华;康永国;;基于多元激励的高质量语音合成声学模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
10 吴志勇;蔡莲红;蒙美玲;;可视语音合成中基于音视频关联模型的视位参数优化[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 记者 桂运安;中科大11项语音合成指标世界第一[N];安徽日报;2014年
2 本报记者 何进伟;语音合成露峥嵘[N];网络世界;2001年
3 李羚;多语种语音合成助力数字奥运[N];中国计算机报;2003年
4 清华大学计算机系人机交互与媒体集成研究所 陶建华 蔡莲红;语音合成的应用系统设计[N];计算机世界;2001年
5 ;嵌入式语音合成平台[N];计算机世界;2002年
6 孙晓闻;语音合成 让机器“像人一样说话”[N];中国劳动保障报;2005年
7 ;新型语音合成软件面世[N];人民邮电;2008年
8 炎黄新星公司供稿;炎黄之声SinoSonic[N];计算机世界;2002年
9 刘权;语音合成融入证券客服[N];中国计算机报;2003年
10 ;语音产品走向开放式架构[N];中国计算机报;2004年
中国博士学位论文全文数据库 前10条
1 高莹莹;面向情感语音合成的言语情感建模研究[D];北京交通大学;2016年
2 高裴裴;人眼驱动语音合成的若干关键技术研究[D];南开大学;2012年
3 赵晖;真实感汉语可视语音合成关键技术研究[D];国防科学技术大学;2010年
4 苏庄銮;情感语音合成[D];中国科学技术大学;2006年
5 卢恒;基于统计模型与发音错误检测的语音合成方法研究[D];中国科学技术大学;2011年
6 雷鸣;统计参数语音合成中的声学模型建模方法研究[D];中国科学技术大学;2012年
7 蔡明琦;融合发音机理的统计参数语音合成方法研究[D];中国科学技术大学;2015年
8 凌震华;基于统计声学建模的语音合成技术研究[D];中国科学技术大学;2008年
9 杨辰雨;语音合成音库自动标注方法研究[D];中国科学技术大学;2014年
10 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
中国硕士学位论文全文数据库 前10条
1 王泽勋;多层次韵律和短时谱同步变换的情感语音合成[D];苏州大学;2015年
2 熊林云;基于ARM Cortex-M3的语音合成软件系统设计与实现[D];电子科技大学;2014年
3 章琴;基于HMM的中文情感语音合成的研究[D];合肥工业大学;2014年
4 李冰洁;基于声韵母的嵌入式语音合成[D];北京交通大学;2016年
5 李焕君;个性化语音合成在船舶导航系统中应用研究[D];大连海事大学;2016年
6 冯欢;基于HMM的歌词到歌声转换的研究[D];西北师范大学;2015年
7 王海燕;汉藏双语跨语言统计参数语音合成的研究[D];西北师范大学;2015年
8 孙晓辉;结合听感度量的语音合成方法研究[D];中国科学技术大学;2016年
9 李翔凰;基于HMM-RBM的蒙古语语音合成研究[D];内蒙古大学;2016年
10 王雨蒙;英语文语转换系统中的ToBl韵律自动标注方法与实现[D];云南大学;2016年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026