收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于语块的汉语韵律短语边界识别研究

冯志茹  
【摘要】:科技在进步,时代在发展,在这个“读图”和“听音”的时代,语音技术深入到人们生活的各方各面,让机器说话已不是幻想。然而,目前语音合成的质量仍不是很高,主要表现在:合成的语音自然度低、节奏感差,所以,语音合成自然度的进一步提高是目前亟待解决的问题。本文的研究工作主要针对汉语韵律结构中的韵律短语识别展开。韵律结构是以句法结构为基础的。通过对大量语料的分析可以看出,韵律结构和句法结构之间存在着一定的联系。由于语块本身可以反映出一定的句法信息,且人们在朗读或说话时往往是以语块为基本单位的,语块的切分可以把句法上相关的词进行整合,所以本文提出将语块结构这种非递归嵌套的浅层句法结构应用于韵律短语的预测。本文的主要工作包括以下几个方面:(1)语块的定义及获取目前对韵律层级的划分所使用的特征多为词、词性和词长。基于这些特征的局限性和韵律结构与句法信息之间的紧密联系,在对汉语语块结构与韵律结构之间的关系进行比较研究的基础上,本文定义了8种适用于韵律短语边界识别的语块类型,并归纳总结了语块的处理规则,通过语块之间结合紧密度的度量,实现了语块的归并,生成了最终的语块结构。(2)基于语块和条件随机场的韵律短语识别本文将语块结构这种非递归嵌套的浅层句法结构应用于韵律短语的预测,提出了一种基于语块信息,并利用条件随机场CRFs对韵律短语进行识别的方法。首先基于语块结构抽取、选择模型特征,然后利用CRFs训练构建模型用于韵律短语的识别。(3)基于语块和AdaBoost-SVM集成算法的韵律短语识别由于寻找一种较强的分类算法用于韵律短语的识别较为困难,基于强、弱学习算法的等价性问题,利用集成学习方法能够使多个准确率略高于随机猜测弱分类器进行加权融合,形成一个强学习算法,达到比强分类器更好的分类效果,所以,本文使用AdaBoost集成学习算法,以SVM作为基分类器,通过对训练语料多次随机抽取,经过多次训练更改权重,训练生成多个基分类器,最终将这几个基分类器进行加权投票的方法集成,形成一个新的强分类器完成对韵律短语的预测。本文分别使用CRFs、CRFs+语块、SVM、SVM+语块、AdaBoost-SVM+语块的方法实现了韵律短语边界的识别模型,并将各个模型的性能进行了对比,重点考察了使用语块信息与否时的模型性能。实验结果显示,在各种不同的方法下,引入语块结构后,模型的性能均比之前有了较为明显的提升。这就证明,语块信息能够在韵律结构的识别研究中得到应用并做出积极有效的贡献。


知网文化
【相似文献】
中国期刊全文数据库 前16条
1 王利;王永生;;基于语块的英语文语转换系统的韵律生成方法[J];计算机辅助工程;2007年01期
2 鲁川,梁镇韩;信息处理用规则汉语[J];中文信息学报;1987年04期
3 张薇;;语块理论下高中英语词汇教学的再思考[J];现代教学;2013年04期
4 程葳,赵军,徐波,刘非凡;一种面向汉英口语翻译的双语语块处理方法[J];中文信息学报;2003年02期
5 姜柄圭;张秦龙;谌贻荣;常宝宝;;面向机器辅助翻译的汉语语块自动抽取研究[J];中文信息学报;2007年01期
6 王立河;;语块教学法在对外汉语阅读教学中的作用[J];新闻传播;2013年05期
7 逯万辉;马建霞;范云满;;基于CRFs和语块分析的中文未登录术语识别研究[J];情报科学;2013年11期
8 梁颖红;曹军;赵铁军;;真实语料下基于多Agent的分布式英语语块识别[J];计算机工程与应用;2008年28期
9 陈宏;;语块教学理论与提高大学生英语输出能力研究[J];安徽电子信息职业技术学院学报;2010年02期
10 程葳,赵军,刘非凡,徐波;面向口语翻译的双语语块自动识别[J];计算机学报;2004年08期
11 周玉,宗成庆,徐波;基于多层过滤的统计机器翻译[J];中文信息学报;2005年03期
12 熊秋平;管新潮;;基于工作研究的语块提取系统PhrasExt软件设计[J];工业工程与管理;2011年01期
13 刘兵;钱龙华;徐华;周国栋;;依存信息在蛋白质关系抽取中的作用[J];中文信息学报;2011年02期
14 梁颖红;曹军;;文本语块识别典型方法的比较与分析[J];计算机技术与发展;2008年11期
15 张春祥;李生;赵铁军;;基于中心语块扩展的短语对齐[J];计算机研究与发展;2006年09期
16 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 周强;詹卫东;任海波;;构建大规模的汉语语块库[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 邱丽娜;;从语块学习与重复模仿谈大学英语口语教学[A];福建省外国语文学会2008年年会论文集[C];2008年
3 洪蕾;;语块理论在创新大学英语中的运用[A];传承创新 跨越发展——2012年贵州省社会科学学术年会第三分会场暨贵州省外语学会学术研讨会论文集[C];2012年
4 洪蕾;;语块理论在创新大学英语中的运用[A];贵州省外语学会2012年学术研讨会论文集[C];2012年
5 程葳;邱立坤;;限定领域汉英口语双语语块库的构建[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 翟玉玺;;准中级汉语口语中的语块产出研究[A];北京地区对外汉语教学研究生论坛论文集[C];2013年
7 周玉;宗成庆;徐波;;基于多层过滤的统计机器翻译[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 宋慧曼;程葳;;关于双语语块规范的几个问题[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 钱娟;王立非;;“CCTV杯”英语演讲中的语块对比研究[A];全球化中的英语演讲:挑战与创新——首届全国英语演讲教学与研究学术研讨会论文集[C];2007年
10 梁颖红;;真实语料下基于多Agent分布式英语[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年
中国博士学位论文全文数据库 前4条
1 周荣;英语情绪类语块认知隐喻研究[D];中央民族大学;2012年
2 石洛祥;中国英语学习者惯用语块习得研究[D];西南大学;2009年
3 李慧;现代汉语“V_单+NP”语块研究[D];北京语言大学;2008年
4 甄凤超;基于语料库的中国英语外语学习者口语交际能力研究:COLSEC中的预构成语块、图式、语用特征及策略[D];上海交通大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978