收藏本站
《云南大学》 2013年
收藏 | 手机打开
二维码
手机客户端打开本文

基于语音识别和语音合成的汉语语音转换技术研究

何彬  
【摘要】:语音转换是语音信号处理领域一个比较新颖的技术,它是改变一个说话人的语音,使之听起来像是另外一个人的语音的技术。这项技术结合了语音信号处理领域的各种技术,如语音信号分析,语音识别,语音合成,语音增强等。本文以开发汉语语音转换系统为目的,采用HMM语音识别和语音合成方法,研究汉语语音转换技术。 根据汉语的特点,本文选择声母和韵母为语音识别和语音合成的基本单元。一个完整的语音转换系统由语音识别、参数转换和语音合成三部分组成。论文的主要工作包括: 1.阐述语音转换系统的框架和实验数据准备,包括在考虑声母、韵母和音节覆盖率的前提下收集挑选1000句录音语料,邀请4位发音人录制语音库,录音格式转换,语音校对,对语音库中的语句进行语音识别,并从语音识别结果中提取声韵母时间信息。 2.对语音识别结果进行人工校对、调整,在对声母时长进行统计的基础上产生韵律标记,生成单音子和三音子训练标注文件,为训练HMM合成器设计上下文属性和问题集,并在HTS-2.0平台进行HMM合成器的训练。 3.按上述方法,产生两个说话人的HMM模型,将待转换语句的标注文件分别通过两个模型产生声学参数,再利用插值的方法生成第三人,也称为“虚拟人”的声学参数。 4.将生成的“虚拟人”的参数通过STRAIGHT语音合成器产生语音波形,并对常规语音合成的语句和经过参数转换后产生的语句分别进行MOS评测和ABX评测。 语音合成器的自然度和语音参数转换算法是本文语音转换效果的决定因素。实验结果表明:(1)本文语音合成器的初步MOS主观评测平均为集内4.2,集外3.9,说明语音合成的自然度已基本到达可以接受的水平。(2)采用声学参数插值实现语音转换后,经过ABX主观评测,结果表明该系统能够实现语音转换功能,可以控制转换后的语音更偏向两个源说话人中的某一个,且能综合两个源说话人的个性特征信息。
【学位授予单位】:云南大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TN912.3

手机知网App
【参考文献】
中国期刊全文数据库 前6条
1 冯志伟;;语音合成中的文本归一化问题[J];北华大学学报(社会科学版);2010年02期
2 左国玉,刘文举,阮晓钢;声音转换技术的研究与进展[J];电子学报;2004年07期
3 李剑锋,胡国平,王仁华;基于最大熵模型的韵律短语边界预测[J];中文信息学报;2004年05期
4 吴义坚;王仁华;;基于HMM的可训练中文语音合成[J];中文信息学报;2006年04期
5 刘金凤,符敏,程德福;声音转换实验系统的研究与实现[J];南京理工大学学报(自然科学版);2005年S1期
6 李波,王成友,蔡宣平,唐朝京,张尔扬;语音转换及相关技术综述[J];通信学报;2004年05期
中国博士学位论文全文数据库 前1条
1 吴义坚;基于隐马尔科夫模型的语音合成技术研究[D];中国科学技术大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 陈蕴谷;;基于谱减法和经验模式分解的语音增强[J];安庆师范学院学报(自然科学版);2010年01期
2 宋娟;严翔;王维;王立德;;无线车载语音记录装置的设计与实现[J];北京交通大学学报;2011年05期
3 孔令志;罗森林;张冰;王耀威;;纯音乐与语音-音乐混合片段的高准确识别方法[J];北京理工大学学报;2009年01期
4 于红玉;张旭;苏金霏;王宁宇;;滤波言语测听词表的实现[J];北京生物医学工程;2006年04期
5 王义元,赵黎明;基于小波变换的汉语三字词语音基音频率提取[J];吉林大学学报(信息科学版);2005年01期
6 王秀丽;王树勋;林琳;;基于扩展谱相减与SAP的带噪语音端点检测[J];吉林大学学报(信息科学版);2006年04期
7 冯哲;孙吉贵;张长胜;王岩;;汉语语音合成的研究进展[J];吉林大学学报(信息科学版);2007年02期
8 张余生;夏秀渝;杨莎;;基于神经网络和卡尔曼滤波算法的说话人识别[J];成都信息工程学院学报;2008年04期
9 冀常鹏;高茉;;嘈杂环境下语音信号端点检测方法研究[J];成都信息工程学院学报;2011年03期
10 吴晶;柳洪轶;;基于子带编码的数字音频水印算法研究[J];长春工程学院学报(自然科学版);2008年03期
中国重要会议论文全文数据库 前10条
1 张利军;岳宏达;雷正林;;基于短时傅立叶变换的人工电子耳蜗言语处理器设计[A];第二十七届中国控制会议论文集[C];2008年
2 董静;刘健刚;;英语寂语声信号检测[A];2011'中国西部声学学术交流会论文集[C];2011年
3 那兴宇;谢湘;匡镜明;何娅玲;;一种用于统计语音合成的大尺度压缩HMM的方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 李雅;潘诗锋;陶建华;;采用重音调整模型的HMM语音合成系统[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
5 刘方舟;周游;陶建华;;用CART模型指导TBL算法预测语调短语[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
6 李曼曼;杨鸿武;洪宁;杨硕;刘亚丽;;基于EMD的带噪语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 江源;朱双华;凌震华;戴礼荣;;基于HMM的单元挑选语音合成中的改进方法研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 高璐;于洪志;蔡莲红;张金爽;郑文思;;基于HMM的藏语语音合成系统中标注体系的构建[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
9 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
10 李雅;潘诗锋;陶建华;;采用重音调整模型的HMM语音合成系统[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
3 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
4 卢恒;基于统计模型与发音错误检测的语音合成方法研究[D];中国科学技术大学;2011年
5 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
6 梁彦霞;低速率多带激励线性预测语音编码技术的研究[D];西安电子科技大学;2011年
7 李烨;基于多带激励模型的低速率语音编码技术研究[D];西安电子科技大学;2011年
8 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
9 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
10 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
中国硕士学位论文全文数据库 前10条
1 王萍;语音情感识别研究[D];山东科技大学;2010年
2 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
3 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
4 刘继芳;基于计算听觉场景分析的混合语音分离研究[D];哈尔滨工程大学;2009年
5 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
6 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
7 孙大为;数字化单边带水声语音通信系统的研究与实现[D];哈尔滨工程大学;2010年
8 陈伟伟;基于鼾声检测的睡眠呼吸暂停低通气综合症诊断[D];大连理工大学;2010年
9 巩俊;语音信号欠定盲源分离技术的研究[D];大连理工大学;2010年
10 翟文博;基于SIP协议框架的语音通信系统的研究与设计[D];大连理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前6条
1 左国玉,刘文举,阮晓钢;声音转换技术的研究与进展[J];电子学报;2004年07期
2 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期
3 牛正雨,柴佩琪;基于边界点词性特征统计的韵律短语切分[J];中文信息学报;2001年05期
4 赵晟,陶建华,蔡莲红;基于规则学习的韵律结构预测[J];中文信息学报;2002年05期
5 聂鑫,王作英;汉语语句中短语间停顿的自动预测方法[J];中文信息学报;2003年04期
6 吴义坚;王仁华;;基于HMM的可训练中文语音合成[J];中文信息学报;2006年04期
中国重要会议论文全文数据库 前2条
1 初敏;;韵律研究与合成语音的自然度[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
2 秦龙;吴义坚;王仁华;;基于HMM的说话人转换中MLLR回归矩阵绑定方法的研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
【相似文献】
中国期刊全文数据库 前10条
1 罗三定,贾建华,沙莎;基于波形音频段处理的中文语音合成研究[J];电脑与信息技术;2002年01期
2 ;国内语音合成领域专利技术发展趋势[J];电子知识产权;2003年10期
3 王永生;柴佩琪;曾令平;;英语语音合成中基于约束树的音节切分算法[J];微型电脑应用;2005年11期
4 王仁华;戴礼荣;凌震华;胡郁;;基于统计建模的可训练单元挑选语音合成方法[J];科学通报;2009年08期
5 杨志晓;隋菲;张德贤;;基于可视语音合成的3D通信技术研究[J];计算机应用研究;2009年11期
6 高璐;陈琪;李永宏;于洪志;;藏语语音合成中文本分析的若干问题研究[J];西北民族大学学报(自然科学版);2010年02期
7 孙永欣;苏瑞;;具有TTS功能的同步朗读系统[J];自动化技术与应用;2011年06期
8 杨风健;;轻松学会语音合成[J];电子制作;2011年08期
9 郭淑妮;图雅;斯琴高娃;;蒙古语语音合成语料库的设计及韵律标注规范的建立[J];电脑与电信;2012年03期
10 曲珍;春燕;;藏语语音合成中语料数据标注规则的设计[J];西藏大学学报(自然科学版);2012年01期
中国重要会议论文全文数据库 前10条
1 杨静;孙金城;;关于录制语音合成数据库的几个问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
2 徐俊;蔡莲红;吴志勇;;多语种语音合成平台的设计与实现[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 陈益强;高文;王兆其;杨长水;姜大龙;;多模式语音合成[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 陶建华;董宏辉;许晓颖;;情感语音合成的关键技术分析[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
5 刘东华;冯静;力梅;;深圳市新一代“12121”语音合成业务系统[A];中国气象学会2007年年会气象软科学论坛分会场论文集[C];2007年
6 黄小明;熊子瑜;;基于古音系统的汉语方言语音合成研究[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
7 邹煜;何伟;侯敏;滕永林;朱维彬;;面向语音合成的新闻播报语音库构建及其特殊韵律结构[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 贺琳;张蕊;俞舸;;大规模语音合成语料库的录制及常见问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
9 陶建华;康永国;;基于多元激励的高质量语音合成声学模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
10 吴志勇;蔡莲红;蒙美玲;;可视语音合成中基于音视频关联模型的视位参数优化[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 记者 桂运安;中科大11项语音合成指标世界第一[N];安徽日报;2014年
2 本报记者 何进伟;语音合成露峥嵘[N];网络世界;2001年
3 李羚;多语种语音合成助力数字奥运[N];中国计算机报;2003年
4 清华大学计算机系人机交互与媒体集成研究所 陶建华 蔡莲红;语音合成的应用系统设计[N];计算机世界;2001年
5 ;嵌入式语音合成平台[N];计算机世界;2002年
6 孙晓闻;语音合成 让机器“像人一样说话”[N];中国劳动保障报;2005年
7 ;新型语音合成软件面世[N];人民邮电;2008年
8 炎黄新星公司供稿;炎黄之声SinoSonic[N];计算机世界;2002年
9 刘权;语音合成融入证券客服[N];中国计算机报;2003年
10 ;语音产品走向开放式架构[N];中国计算机报;2004年
中国博士学位论文全文数据库 前8条
1 高裴裴;人眼驱动语音合成的若干关键技术研究[D];南开大学;2012年
2 赵晖;真实感汉语可视语音合成关键技术研究[D];国防科学技术大学;2010年
3 苏庄銮;情感语音合成[D];中国科学技术大学;2006年
4 卢恒;基于统计模型与发音错误检测的语音合成方法研究[D];中国科学技术大学;2011年
5 雷鸣;统计参数语音合成中的声学模型建模方法研究[D];中国科学技术大学;2012年
6 凌震华;基于统计声学建模的语音合成技术研究[D];中国科学技术大学;2008年
7 杨辰雨;语音合成音库自动标注方法研究[D];中国科学技术大学;2014年
8 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
中国硕士学位论文全文数据库 前10条
1 聂军;基于HMM可训练的汉语语音合成系统[D];吉林大学;2010年
2 曾一鸣;情感语音合成的研究和系统实现[D];上海交通大学;2010年
3 刘航;基于隐马尔可夫模型的跨语种语音合成方法研究[D];中国科学技术大学;2011年
4 张桂香;个性化语音合成的研究与实现[D];哈尔滨工程大学;2007年
5 胡琼;基于隐马尔科夫模型的天津方言语音合成[D];上海交通大学;2011年
6 刘博;藏语拉萨方言的统计参数语音合成的研究[D];西北师范大学;2012年
7 吕斌;嵌入式语音合成及其关键算法的研究与实现[D];西安电子科技大学;2009年
8 吴振宇;个性特征的语音合成与模拟技术研究[D];华东师范大学;2011年
9 张鹏;汉语语音合成韵律控制方法与实现的研究[D];哈尔滨工程大学;2006年
10 鲁小勇;情感语音合成的研究[D];西北师范大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026