收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于主动学习的汉语韵律短语预测研究

周纯  
【摘要】:随着计算机智能化的飞速发展,语音合成技术越来越广泛的应用到人们的生活中。提高语音合成的自然度是语音合成技术的一个重要发展方向,而韵律结构预测的准确度不高,是提高合成语音自然度的一大障碍。 本文调研了汉语韵律结构预测研究的历史和现状,分析并总结了目前汉语韵律结构预测采用的相关技术。与其他各种机器学习问题类似,汉语韵律短语的预测也需要一定数量的己标注数据用作训练数据,这就需要大量的时间和人力放在韵律短语的标注上,这也是传统分类算法所共有的问题。对此,近年来产生了一种新的思路,就是通过综合使用已标注数据和未标注数据,联合进行训练,以弥补标注数据不足所带来的影响,从而可以大大降低人工标注工作量。半监督学习、主动学习等方法,都是由此思路而产生的。 基于此,本文将基于条件随机场模型的主动学习方法用于汉语韵律短语预测,并实现了一个汉语韵律短语边界预测及标注的原型系统。 本文实现的汉语韵律短语边界标注及预测的原型系统采用人机交互的方式,基于部分标注的训练集由计算机选出最佳样例由人工进行标注,进而更新己标注的训练集,依此迭代直到训练出令用户满意的模型。此外,本文通过实验对比证明应用该方法可以较好地解决汉语韵律短语预测和标注的主动学习问题,在降低人工工作量,利用部分已标注数据的基础上,仍能较好地达到汉语韵律短语边界预测的目的。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨志强,柴佩琪,牛正雨;汉语韵律短语切分研究[J];计算机工程;2002年02期
2 吴晓慧,柴佩琪;提高韵律短语正确切分方法的研究[J];计算机工程;2003年02期
3 谌卫军,林福宗,李建民,张钹;基于概率统计的韵律短语分析[J];计算机工程与应用;2001年03期
4 应宏,蔡莲红;基于结构助词驱动的韵律短语界定的研究[J];中文信息学报;1999年06期
5 钱揖丽;荀恩东;;基于分类回归树CART的汉语韵律短语边界识别[J];计算机工程与应用;2008年06期
6 程勇,吴玺宏,迟惠生;汉语韵律边界定位与选音算法研究[J];北京大学学报(自然科学版);2004年03期
7 牛正雨,柴佩琪;基于边界点词性特征统计的韵律短语切分[J];中文信息学报;2001年05期
8 潘伟锵,贺前华,韦岗;文语转换系统中虚词停顿的研究[J];华南理工大学学报(自然科学版);2002年06期
9 赵晟,陶建华,蔡莲红;基于规则学习的韵律结构预测[J];中文信息学报;2002年05期
10 董宏辉;陶建华;徐波;;基于约束模型的韵律短语预测[J];中文信息学报;2007年01期
11 裴雨来;邱金萍;王洪君;吕士楠;;基于词类序列的汉语语句韵律结构预测[J];清华大学学报(自然科学版);2009年S1期
12 杨鸿武;王晓丽;陈龙;裴东;郭威彤;蔡莲红;;基于语法树高度的汉语韵律短语预测[J];计算机工程与应用;2010年36期
13 郑敏;蔡莲红;;基于概率频度的普通话韵律结构预测统计模型[J];清华大学学报(自然科学版);2006年01期
14 荀恩东;钱揖丽;郭庆;宋柔;;应用二叉树剪枝识别韵律短语边界[J];中文信息学报;2006年03期
15 董远;周涛;董乘宇;王海拉;;条件随机场模型在韵律结构预测中的应用[J];北京邮电大学学报;2009年05期
16 王永鑫;蔡莲红;;语法信息与韵律结构的分析与预测[J];中文信息学报;2010年01期
17 胡文英;祖漪清;王志中;;语句的基频曲线预测[J];声学学报(中文版);2006年01期
18 邵艳秋;穗志方;韩纪庆;吴云芳;;基于依存句法分析的汉语韵律层级自动预测技术研究[J];中文信息学报;2008年02期
19 徐俊;蔡莲红;;面向情感转换的层次化韵律分析与建模[J];清华大学学报(自然科学版);2009年S1期
20 努尔比娅·塔依尔;艾斯卡尔·肉孜;古丽娜尔·艾力;地里木拉提·吐尔逊;;维吾尔语陈述句韵律层级停顿模型研究[J];计算机与现代化;2010年07期
中国重要会议论文全文数据库 前10条
1 黄贤军;杨玉芳;;韵律短语的音高下倾研究[A];第十届全国心理学学术大会论文摘要集[C];2005年
2 陶建华;董宏辉;;韵律短语的语法约束研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 杨辰雨;朱立新;凌震华;戴礼荣;;基于Viterbi解码的中文合成音库韵律短语边界自动标注[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
4 黄贤军;杨玉芳;吕士楠;;韵律短语的音高下倾实验研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
5 杨辰雨;朱立新;凌震华;戴礼荣;;基于Viterbi解码的中文韵律短语边界自动标注[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
6 朱维彬;;基于听觉感知的汉语重音自动检测器优化[A];第八届全国人机语音通讯学术会议论文集[C];2005年
7 蔡莲红;王永鑫;杨鸿武;;韵律与语法、语义的协同处理[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 王洪君;;普通话节律与句法语用关联之再探[A];第八届全国人机语音通讯学术会议论文集[C];2005年
9 王永鑫;蔡莲红;;语法信息与韵律结构的分析与预测[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 郑敏;蔡莲红;;一种新的基于规则的多音字自动注音方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 殷治纲;汉语普通话朗读语篇节奏研究[D];中国社会科学院研究生院;2011年
2 敖敏;基于韵律的蒙古语语音合成研究[D];内蒙古大学;2012年
3 邵晓鹏;红外纹理生成方法研究[D];西安电子科技大学;2005年
4 汤步洲;序列标注问题的监督学习方法及应用[D];哈尔滨工业大学;2011年
5 杨锋;中国传统吟诵研究[D];北京大学;2012年
6 禇一平;基于条件随机场模型的视频目标分割算法研究[D];浙江大学;2007年
7 朱红霞;随机场理论在地基可靠度分析中的应用研究[D];天津大学;2008年
8 钱线;快速精确的结构化机器学习方法研究[D];复旦大学;2010年
9 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
10 李方涛;基于产品评论的情感分析研究[D];清华大学;2011年
中国硕士学位论文全文数据库 前10条
1 周纯;基于主动学习的汉语韵律短语预测研究[D];天津师范大学;2012年
2 苏丹;基于半监督学习的汉语韵律短语预测研究[D];天津师范大学;2012年
3 奎丽萍;越南语文语转换技术研究[D];云南大学;2012年
4 努尔比娅·塔依尔;面向语音合成的维吾尔语韵律层级自动标注算法研究[D];新疆大学;2010年
5 李晓红;面向语音合成的文本处理技术的改进[D];北京交通大学;2010年
6 王山雨;面向产品领域的细粒度情感分析技术[D];哈尔滨工业大学;2011年
7 侯立斌;中文事件抽取与缺失角色填充的研究[D];苏州大学;2012年
8 王晓丽;高表现力语音声学建模的研究[D];西北师范大学;2011年
9 贾志浩;汉语语音合成系统的改进与实现[D];南京理工大学;2012年
10 白瑞雪;“动词+在+地点名词”结构中的重新分析现象[D];中国人民解放军外国语学院;2002年
中国重要报纸全文数据库 前10条
1 王文;食品标注热量催生健康新潮[N];中国包装报;2009年
2 记者王丹 魏明辉;标注新的历史节点[N];抚顺日报;2010年
3 深圳商报记者 陈美寿;深圳馆的标注是“先锋”[N];深圳商报;2010年
4 东方;服装成分标注也有“潜规则”[N];经理日报;2009年
5 记者 周进文;“言不由衷”的成分标注[N];石狮日报;2011年
6 冯赐杭;谈新中国邮票公元前年份的标注[N];中国集邮报;2009年
7 莱阳市技术监督局 王少华;名称厂址如何标注[N];中国质量报;2000年
8 桂梅;消费者:希望厂家规范标注 厂家:技术问题难统一[N];中国包装报;2009年
9 CUBN记者 严碧华;八千岁酒标注不清厂家表示将规范[N];中国联合商报;2010年
10 肖江;民进会员建议在酒瓶上标注警示语[N];人民政协报;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978