收藏本站
《中国科学技术大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

情感语音合成

苏庄銮  
【摘要】:语音是最理想的人机交互方式之一,而语音合成技术则是实现语音人机交互的基础。从第一个电子语音合成器问世以来,随着各种新技术手段的应用,特别是近年来随着基于基音同步叠加、结合大规模自然语音库和数据挖掘等智能算法的语音合成方法的流行,语音合成技术在可懂度和自然度上达到了相当的水平,并且开始产业化,逐渐进入人们的日常生活。语音合成技术的推广应用,对语音合成的质量提出了更高的要求。如何进一步提高语音合成的表现力,特别是让合成语音能够模拟表达说话人的情感状态,是语音合成未来发展的趋势,也是语音合成研究领域所面临的一个难题。情感语音合成是一个跨学科的、具有很高理论价值和应用价值的研究课题;作为语音合成的一个新的研究方向,正受到众多研究者越来越多的关注。 本文以情感语音的基频特征为主要研究对象,以合成情感语音为主要研究目标,对基于基频特征的情感语音建模以及情感语调规则指导下的情感语音合成器设计等问题进行了较深入的研究。在此基础上,构建了一个语音合成系统,该系统除了可以验证本文提出的模型方法外,还可以作为语音处理相关研究的实验平台,为以后的研究工作创造良好的实验条件。 本文的主要创新点如下: (1)从情感语音处理的需求出发,通过对Fujisaki基频模型进行改进,提出了一种对情感语音基频进行建模的方法。该方法首先利用高通滤波器分离出基频曲线中的低频成分和高频成分,再分别从低频成分和高频成分中提取模型的短语命令参数和声调命令参数。提取命令参数时根据命令响应函数的特性,设计了从左往右、依次迭代提取的方法。该模型方法能够将基频曲线根据明确语音学含义进行参数化,并且模型参数分布与情感模式有一定的对应关系。同已有的同类研究相比较,本文所提出的基频模型能够反映语音的情感特征,所给出的模型参数提取方法简洁、有效,不需要任何手工标注。 (2)提出了一种数据驱动的语调模型方法,建立了特征语调的概念,并将相关的概念和方法用于分析普通话中情感模式对应的情感模式语调。在限定语料长度、结构以及说话人的前提下,采用主成分分析方法获取6个特征语调,借助这6个特征语调表示所有的语调。实验表明,本文提出的特征语调能够在可以接受的误差范围内拟合出所有语调,并且使用特征语调分析出的情感模式语调具有相当的情感表达能力。另外,本文还对采用特征语调表达混合情感模式的相关问题
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:TN912.3

免费申请
【引证文献】
中国期刊全文数据库 前1条
1 黄小明;熊子瑜;;基于古音系统的汉语方言语音合成[J];清华大学学报(自然科学版);2013年06期
中国硕士学位论文全文数据库 前5条
1 谢珊;基于HHT的语音情感识别研究[D];湘潭大学;2008年
2 舒昌;基于AMR-WB的参数语音合成技术[D];哈尔滨理工大学;2009年
3 谈文婷;基于内容的视频情感提取算法研究[D];山东建筑大学;2010年
4 党培霞;基于情感基音模板的情感语音合成[D];中南大学;2010年
5 宋秒烨;情感计算的哲学探究[D];东华大学;2013年
【参考文献】
中国期刊全文数据库 前10条
1 王治平,赵力,邹采荣;利用模糊熵进行参数有效性分析的语音情感识别[J];电路与系统学报;2003年03期
2 陈雪勤,赵鹤鸣,陈小平;基于计算听觉场景分析的强噪声背景下基音检测方法[J];电路与系统学报;2003年03期
3 余华,王治平,赵力;语音信号中情感特征的分析和识别[J];电声技术;2004年03期
4 钱向民;包含在语音信号中情感特征的分析[J];电子技术应用;2000年05期
5 张文耀,许刚,王裕国;循环AMDF及其语音基音周期估计算法[J];电子学报;2003年06期
6 李香春,杜利民;一种基于多尺度边缘特征提取的基音检测算法[J];电子学报;2003年10期
7 赵力,将春辉,邹采荣,吴镇扬;语音信号中的情感特征分析和识别的研究[J];电子学报;2004年04期
8 沈炯;汉语语调构造和语调类型[J];方言;1994年03期
9 冯康,时慧琨;一种参考短时平均能量和平均幅度差函数的基音检测方法[J];淮南师范学院学报;2003年05期
10 陈洪立;一种基音周期估计方法[J];江西通信科技;2004年02期
中国重要会议论文全文数据库 前2条
1 初敏;;韵律研究与合成语音的自然度[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
2 陶建华;许晓颖;;面向情感的语音合成系统[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年
中国硕士学位论文全文数据库 前2条
1 王青;基于神经网络的汉语语音情感识别的研究[D];浙江大学;2004年
2 曹鹏;语音情感识别技术的研究与实现[D];江苏大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 张许诺;;婴儿如何从成人语言输入中识别普通话声调类别[J];安徽文学(下半月);2011年02期
2 曾常年;动词重叠式中动词的语义虚化与发音轻化[J];北京大学学报(哲学社会科学版);2001年S1期
3 程勇,吴玺宏,迟惠生;汉语韵律边界定位与选音算法研究[J];北京大学学报(自然科学版);2004年03期
4 熊峻江,尚大晶,郭爱民;直升机声疲劳源的诊断技术研究[J];北京航空航天大学学报;2002年02期
5 王泽,朱贻盛,王自明,张红煊;基于ICA的重叠语音基频提取和语音增强[J];北京生物医学工程;2001年04期
6 夏小亮;周明全;王学松;李鹏;李娟;;基于分句匹配的哼唱音乐检索系统的算法研究与实现[J];北京师范大学学报(自然科学版);2011年04期
7 王民;曹绘;要趁红;;一种改进的小波变换基音检测算法[J];重庆邮电大学学报(自然科学版);2012年03期
8 巩向博;韩立国;王恩利;杜立志;;压制噪声的高分辨率Radon变换法[J];吉林大学学报(地球科学版);2009年01期
9 齐文静;王文婷;王雪;;中国英语学习者列举并列成分语调的实验语音学研究[J];长春师范学院学报;2012年07期
10 冯哲;孙吉贵;张长胜;王岩;;汉语语音合成的研究进展[J];吉林大学学报(信息科学版);2007年02期
中国重要会议论文全文数据库 前10条
1 张鹏;王丽红;刘胜;;汉语语音合成语调基频曲线的合成及控制方法的研究[A];第二十七届中国控制会议论文集[C];2008年
2 周洁;;基于高斯混合模型的情感语音转换[A];2011'中国西部声学学术交流会论文集[C];2011年
3 李雅;潘诗锋;陶建华;;采用重音调整模型的HMM语音合成系统[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 李卫君;陈玉东;杨玉芳;吕士楠;;近体诗绝句的声学特征分析[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
5 卢颖超;李雅;陶建华;许小颖;;连续语流中重音标注和大规模重音语料库建设[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
6 李雅;潘诗锋;陶建华;;采用重音调整模型的HMM语音合成系统[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
7 卢颖超;李雅;陶建华;许小颖;;连续语流中重音标注和大规模重音语料库建设[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
8 曹剑芬;;汉语语调研究中的若干问题[A];第九届中国语音学学术会议论文集[C];2010年
9 丁雪;安翔;孟子厚;;京味吆喝声的韵律特征分析[A];第九届中国语音学学术会议论文集[C];2010年
10 尹基德;孔江平;;普通话语句重音的嗓音发声表现研究[A];第九届中国语音学学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 柳春;甘肃临夏方言回腔语音格局研究[D];西北民族大学;2010年
2 于辉;汉语借词音系学[D];南开大学;2010年
3 郭嘉;英语语调实验分析研究[D];南开大学;2010年
4 李凤杰;汉英对比韵律系学中的若干问题[D];南开大学;2010年
5 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
6 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
7 姜燕;汉语口语美学研究[D];山东师范大学;2011年
8 巩向博;金属矿地震高精度成像与数据处理方法研究[D];吉林大学;2011年
9 金星;听障儿童韵律词重音的声学特征及生成特征的研究[D];华东师范大学;2011年
10 乌吉斯古冷;蒙古语标准音朗读语句语调的起伏度研究[D];内蒙古大学;2011年
中国硕士学位论文全文数据库 前10条
1 王萍;语音情感识别研究[D];山东科技大学;2010年
2 方逸飞;汉西语音对比以及针对西语学生的汉语教学研究[D];上海外国语大学;2010年
3 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
4 刘波;文本驱动的可视语音合成技术研究[D];哈尔滨工程大学;2010年
5 陈琪;基于RBF的语音情感识别方法研究[D];长沙理工大学;2010年
6 冯涛;赵元任汉语国际教育思想与实践研究[D];陕西师范大学;2010年
7 左石凯;语音合成算法研究与FPGA实现[D];哈尔滨理工大学;2010年
8 丁雄勇;仿真机器人控制系统[D];南昌大学;2010年
9 石亚楠;基于MELP的低速率语音编码算法研究[D];西安电子科技大学;2010年
10 周雯;声音内容特征控制的动画自动生成系统研究[D];山东师范大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 李永明,陈弘毅,于政;线性预测编码(LPC)语音合成器的设计[J];半导体学报;1997年02期
2 王志良;人工心理学──关于更接近人脑工作模式的科学[J];北京科技大学学报;2000年05期
3 冯哲;孙吉贵;张长胜;王岩;;汉语语音合成的研究进展[J];吉林大学学报(信息科学版);2007年02期
4 盖强,马孝江,张海勇,邹岩崑;一种消除局域波法中边界效应的新方法[J];大连理工大学学报;2002年01期
5 王伟凝,余英林;图像的情感语义研究进展[J];电路与系统学报;2003年05期
6 王先全,李建蜀;WAVE声音文件格式的分析及其合成[J];电脑开发与应用;1999年07期
7 张韬,裘正定;自适应多速率宽带编码标准AMR-WB及应用[J];电声技术;2004年10期
8 卢官明,李海波;音频编解码技术及应用[J];电声技术;2005年07期
9 赵力,将春辉,邹采荣,吴镇扬;语音信号中的情感特征分析和识别的研究[J];电子学报;2004年04期
10 郭丽娟;;浅谈情感计算[J];福建电脑;2006年02期
中国重要会议论文全文数据库 前3条
1 周斌;凌震华;双志伟;王仁华;;基于逆滤波和LF声源建模的语音合成器研究[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
2 陶建华;许晓颖;;面向情感的语音合成系统[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年
3 谢波;韦璇;陈根才;陈纯;;普通话情感语音数据库及其韵律特征的统计分析[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年
中国重要报纸全文数据库 前3条
1 傅小兰;[N];中国社会科学院报;2009年
2 清华大学计算机系人机交互与媒体集成研究所 陶建华 蔡莲红;[N];计算机世界;2001年
3 傅小兰;[N];计算机世界;2004年
中国博士学位论文全文数据库 前5条
1 吴义坚;基于隐马尔科夫模型的语音合成技术研究[D];中国科学技术大学;2006年
2 谢波;普通话语音情感识别关键技术研究[D];浙江大学;2006年
3 刘伟锋;人脸表情识别研究[D];中国科学技术大学;2007年
4 杨国亮;人工心理相关技术研究—面部表情识别与情感建模[D];北京科技大学;2006年
5 于冬梅;情感计算关键技术研究[D];东华大学;2009年
中国硕士学位论文全文数据库 前8条
1 胡琼;基于隐马尔科夫模型的天津方言语音合成[D];上海交通大学;2011年
2 贾建华;语音合成及语音处理[D];中南大学;2002年
3 王青;基于神经网络的汉语语音情感识别的研究[D];浙江大学;2004年
4 刘磊;HTS汉语合成及其自然度的研究[D];大连理工大学;2006年
5 芦涛;基于SVM的汉语语音情感识别的研究[D];燕山大学;2007年
6 任蕊;基于Fujisaki模型的情感语音信号分析与合成[D];北京交通大学;2008年
7 李晋涛;情感守恒假说及其认知意义[D];山西大学;2007年
8 林本敬;情感虚拟人技术在人机交互中的应用研究[D];北京化工大学;2009年
【二级引证文献】
中国期刊全文数据库 前2条
1 任鹏辉;张雪英;孙颖;;面向语音情感计算的数据库的构建与应用研究[J];电视技术;2012年21期
2 王华;樊养余;;人脸语音动画中基于PSOLA的情感语音合成系统[J];计算机应用研究;2012年03期
中国硕士学位论文全文数据库 前7条
1 景娟;中文话费文语转换系统的研究与实现[D];中南大学;2011年
2 刘向宇;基于CTI的社会保障语音服务系统的设计与实现[D];上海交通大学;2013年
3 李文月;人工语音带宽扩展算法研究[D];大连理工大学;2013年
4 侯丽霞;HHT在语音增强和语音端点检测中的应用研究[D];湘潭大学;2012年
5 吴进;基于HHT算法的移频轨道电路频率参数检测研究[D];兰州交通大学;2013年
6 李冰洁;采用谱—韵律双变换的语音情感转换[D];苏州大学;2013年
7 李虎孬;情感语音合成之语料库的创建[D];新疆大学;2014年
【二级参考文献】
中国期刊全文数据库 前10条
1 林茂灿;普通话语句的韵律结构和基频(F_0)高低线构建[J];当代语言学;2002年04期
2 王治平,赵力,邹采荣;利用模糊熵进行参数有效性分析的语音情感识别[J];电路与系统学报;2003年03期
3 董远,胡光锐;语音识别的非线性方法[J];电路与系统学报;1998年01期
4 赵知劲,吴杰;一种小波变换与自相关结合的基音周期检测法[J];电声技术;1999年11期
5 赵瑞珍,宋国乡;基音检测的小波快速算法[J];电子科技;1998年01期
6 王都生,铁满霞,樊昌信;一种实时基音检测算法[J];电子学报;2000年10期
7 赵力,将春辉,邹采荣,吴镇扬;语音信号中的情感特征分析和识别的研究[J];电子学报;2004年04期
8 顾良,刘润生;高性能汉语语音基音周期估计[J];电子学报;1999年01期
9 林茂灿 ,颜景助;北京话轻声的声学性质[J];方言;1980年03期
10 林茂灿 ,颜景助 ,孙国华;北京话两字组正常重音的初步实验[J];方言;1984年01期
中国重要会议论文全文数据库 前6条
1 初敏;;韵律研究与合成语音的自然度[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
2 贺琳;吕士楠;冯勇强;初敏;钱瑶;;汉语合成语料库的韵律层级标注研究[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
3 陶建华;蔡莲红;吴志勇;;基于统计模型的韵律建模方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 吴志勇;蔡莲红;陶建华;;基于汉语韵律参数的语音基元选取[A];第六届全国人机语音通讯学术会议论文集[C];2001年
5 吴健辉;罗跃嘉;;情绪的认知科学研究途径[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年
6 陈建厦;;语音情感识别综述[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年
中国博士学位论文全文数据库 前1条
1 王茂林;普通话自然话语的韵律模式[D];中国社会科学院研究生院;2003年
【相似文献】
中国期刊全文数据库 前10条
1 郝杰;语音合成:引领“耳朵经济”[J];中国电子商务;2001年Z2期
2 罗三定,贾建华,沙莎;基于波形音频段处理的中文语音合成研究[J];电脑与信息技术;2002年01期
3 ;国内语音合成领域专利技术发展趋势[J];电子知识产权;2003年10期
4 王永生;柴佩琪;曾令平;;英语语音合成中基于约束树的音节切分算法[J];微型电脑应用;2005年11期
5 王仁华;戴礼荣;凌震华;胡郁;;基于统计建模的可训练单元挑选语音合成方法[J];科学通报;2009年08期
6 杨志晓;隋菲;张德贤;;基于可视语音合成的3D通信技术研究[J];计算机应用研究;2009年11期
7 高璐;陈琪;李永宏;于洪志;;藏语语音合成中文本分析的若干问题研究[J];西北民族大学学报(自然科学版);2010年02期
8 孙永欣;苏瑞;;具有TTS功能的同步朗读系统[J];自动化技术与应用;2011年06期
9 杨风健;;轻松学会语音合成[J];电子制作;2011年08期
10 郭淑妮;图雅;斯琴高娃;;蒙古语语音合成语料库的设计及韵律标注规范的建立[J];电脑与电信;2012年03期
中国重要会议论文全文数据库 前10条
1 杨静;孙金城;;关于录制语音合成数据库的几个问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
2 徐俊;蔡莲红;吴志勇;;多语种语音合成平台的设计与实现[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 陈益强;高文;王兆其;杨长水;姜大龙;;多模式语音合成[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 陶建华;董宏辉;许晓颖;;情感语音合成的关键技术分析[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
5 刘东华;冯静;力梅;;深圳市新一代“12121”语音合成业务系统[A];中国气象学会2007年年会气象软科学论坛分会场论文集[C];2007年
6 黄小明;熊子瑜;;基于古音系统的汉语方言语音合成研究[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
7 邹煜;何伟;侯敏;滕永林;朱维彬;;面向语音合成的新闻播报语音库构建及其特殊韵律结构[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 贺琳;张蕊;俞舸;;大规模语音合成语料库的录制及常见问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
9 陶建华;康永国;;基于多元激励的高质量语音合成声学模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
10 吴志勇;蔡莲红;蒙美玲;;可视语音合成中基于音视频关联模型的视位参数优化[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 记者 桂运安;中科大11项语音合成指标世界第一[N];安徽日报;2014年
2 本报记者 何进伟;语音合成露峥嵘[N];网络世界;2001年
3 李羚;多语种语音合成助力数字奥运[N];中国计算机报;2003年
4 清华大学计算机系人机交互与媒体集成研究所 陶建华 蔡莲红;语音合成的应用系统设计[N];计算机世界;2001年
5 ;嵌入式语音合成平台[N];计算机世界;2002年
6 孙晓闻;语音合成 让机器“像人一样说话”[N];中国劳动保障报;2005年
7 ;新型语音合成软件面世[N];人民邮电;2008年
8 炎黄新星公司供稿;炎黄之声SinoSonic[N];计算机世界;2002年
9 刘权;语音合成融入证券客服[N];中国计算机报;2003年
10 ;语音产品走向开放式架构[N];中国计算机报;2004年
中国博士学位论文全文数据库 前9条
1 高裴裴;人眼驱动语音合成的若干关键技术研究[D];南开大学;2012年
2 赵晖;真实感汉语可视语音合成关键技术研究[D];国防科学技术大学;2010年
3 苏庄銮;情感语音合成[D];中国科学技术大学;2006年
4 卢恒;基于统计模型与发音错误检测的语音合成方法研究[D];中国科学技术大学;2011年
5 雷鸣;统计参数语音合成中的声学模型建模方法研究[D];中国科学技术大学;2012年
6 蔡明琦;融合发音机理的统计参数语音合成方法研究[D];中国科学技术大学;2015年
7 凌震华;基于统计声学建模的语音合成技术研究[D];中国科学技术大学;2008年
8 杨辰雨;语音合成音库自动标注方法研究[D];中国科学技术大学;2014年
9 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
中国硕士学位论文全文数据库 前10条
1 聂军;基于HMM可训练的汉语语音合成系统[D];吉林大学;2010年
2 曾一鸣;情感语音合成的研究和系统实现[D];上海交通大学;2010年
3 刘航;基于隐马尔可夫模型的跨语种语音合成方法研究[D];中国科学技术大学;2011年
4 张桂香;个性化语音合成的研究与实现[D];哈尔滨工程大学;2007年
5 胡琼;基于隐马尔科夫模型的天津方言语音合成[D];上海交通大学;2011年
6 刘博;藏语拉萨方言的统计参数语音合成的研究[D];西北师范大学;2012年
7 吕斌;嵌入式语音合成及其关键算法的研究与实现[D];西安电子科技大学;2009年
8 吴振宇;个性特征的语音合成与模拟技术研究[D];华东师范大学;2011年
9 张鹏;汉语语音合成韵律控制方法与实现的研究[D];哈尔滨工程大学;2006年
10 鲁小勇;情感语音合成的研究[D];西北师范大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026