收藏本站
《大连理工大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

语义单元自动获取研究

方淼  
【摘要】: 机器翻译一直以来都是人类的一个梦想,更是一个世界难题,直到今天仍然没有令人满意的机器翻译系统出现。它的困难在于语言知识的复杂性和人类认识语言规律的有限性。从机器翻译的探索道路人们认识到,要想得到高质量的翻译,须对句子的意义进行分析和理解。基于语义单元的机器翻译借助语义单元库对源语言的句子进行语义分析,并展开为目的语言的句子来实现翻译,其核心是建立一个大规模的语义单元库。建立语义单元库需要提取大量的语义单元。人工提取语义单元费时,费力,并且很难做到提取标准的统一;自动获取语义单元是一种高效的方法,具有统一的获取标准。 语义单元自动获取从双语句对中获取语义单元,关键是获取句子的语义单元结构和双语语义单元表示之间的对应关系。针对这些问题本文进行了一系列的研究,主要包括如下三个方面: 1.提出基于语义单元树重构的语义单元半自动获取方法:根据组成语义单元表示的各语言的词语分布具有一定的统计规律性(共现)并且语义单元的构造有一定的模式,获取句子的语义结构和双语的语义单元表示之间的对应关系。该方法首先建立一个预备语义单元库,在语义单元库中搜索构成句义(可弃语义单元)的语义单元,然后对句义进行重构,接下来根据语义单元的组合规律推断产生新的语义单元,将人工检查正确的新语义单元加入语义单元库中。该方法通过循环积累过程来获取语义单元,为语义单元库的构建提供一种可行的解决方案。 2.提出基于转换和映射的语义单元自动获取方法:利用链语法分析和转换实现英语的浅层语义结构分析,并且通过统计词语对齐找到双语的对应关系。该方法基于语义单元的特点和人工获取经验构造一套规则系统对英语句子的链语法分析结果进行处理,从而设定单词在句子中的语义层次并转换生成语义单元的英语表示;然后利用统计双语词对齐将语义单元的英语表示映射为语义单元的汉语表示,从而获得双语语义单元;最后通过语义单元表示常量竞争、合并以及召回等一系列策略对自动提取结果进行优化。该方法不需现成的语义单元的支持,而是通过浅层的语义分析获取语义单元,对词语对齐有一定的容错性。 3.提出基于统计优选的语义单元自动分解方法:利用类比推导对双语句对进行句义分解以获取其语义结构,并同步保持双语的对应关系。该方法首先使用类比的方法对双语句对进行分解,然后对每一个句对的语义单元分解利用参数指数、语言模型指数和翻译模型指数三个统计量,通过多属性决策排序优选最优的分解结果,从而得到语义单元。对产生的可弃语义单元可采用迭代的方法将进一步分解。该方法不受任何语法限制。
【学位授予单位】:大连理工大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:TP391.2

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 官却多杰;欧珠;;藏文机器翻译用句型转换算法研究[J];西藏科技;2011年05期
2 邹心胜;;基于领域本体重用的机器翻译研究[J];情报科学;2011年06期
3 晋耀红;;专利文本翻译中复杂长句翻译算法研究[J];计算机应用研究;2011年08期
4 李文;李淼;梁青;朱海;应玉龙;乌达巴拉;;基于短语统计机器翻译模型蒙古文形态切分[J];中文信息学报;2011年04期
5 张亚军;;汉语-维吾尔语机器翻译解码器研究[J];昌吉学院学报;2011年03期
6 宿建军;张小燕;吐尔洪·吾司曼;李晓;;联合式多引擎维汉机器翻译系统[J];计算机工程;2011年16期
7 王斯日古楞;斯琴图;那顺乌日图;;汉蒙统计机器翻译中的调序方法研究[J];中文信息学报;2011年04期
8 于兴艳;孔真;;浅析基于web的跨语言信息检索之现状[J];信息通信;2011年04期
9 郎君;;统计机器翻译中翻译模型的约简概述[J];智能计算机与应用;2011年03期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 熊维;王震;于新;刘汇丹;诺明花;马龙龙;张立强;洪锦玲;吴健;;ISCAS机器翻译系统与评测技术报告[A];机器翻译研究进展——第七届全国机器翻译研讨会论文集[C];2011年
2 才藏太;;基于规则的汉藏机器翻译系统中二分法的句法分析方法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
3 范莉馨;任福继;宫永喜一;(木厉)内香次;;一个利用句子结构特征实现的中日机器翻译系统[A];中国科学技术协会首届青年学术年会论文集(工科分册·上册)[C];1992年
4 卢丹晖;;机器翻译的应用前景[A];福建省外国语文学会2005年年会暨学术研讨会论文集[C];2005年
5 宋金平;肖健;孙广范;;面向北京奥运会的定制化英汉机器翻译系统[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 董娜;林碧琴;丁丰;;机器翻译中若干问题的探讨[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
7 田中康仁;;关于机器翻译系统未来的方向[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
8 刘树杰;杨沐昀;赵铁军;;翻译规则优化中的分层优化方法[A];第三届学生计算语言学研讨会论文集[C];2006年
9 王瑞英;时念玲;江丽丽;;网络环境下翻译实践与分析[A];中华预防医学会预防医学情报专业委员会第十六届学术交流会论文集[C];2005年
10 胡冠龙;李淼;罗毅;强静;张建;;基于逐次筛选法的多引擎汉民机器翻译系统[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国重要报纸全文数据库 前10条
1 记者 刘阳子;中国专利信息传播与利用进入新阶段[N];中国知识产权报;2008年
2 何中军米海涛 刘群;统计机器翻译系统中的开源软件[N];计算机世界;2007年
3 ;我国首个基于搜索引擎的机器翻译系统问世[N];中国高新技术产业导报;2008年
4 熊德意何中军 刘群;机器翻译渐行渐近[N];计算机世界;2007年
5 董振东;到用户中去[N];中国计算机报;2003年
6 黄瑾刘洋 刘群;机器翻译的自动评测技术[N];计算机世界;2007年
7 李开复;互联网七大趋势[N];21世纪经济报道;2006年
8 李开复;网络改变生活 科技创新世界[N];中国企业报;2006年
9 刘慧敏;多语信息平台让你“读懂”七国语言[N];宁波日报;2007年
10 中科院计算技术研究所 吕雅娟付雷 黄瑾 何中军 刘群;化繁为简的统计机器翻译技术[N];中国计算机报;2007年
中国博士学位论文全文数据库 前9条
1 方淼;语义单元自动获取研究[D];大连理工大学;2008年
2 王博;机器翻译系统的自动评价及诊断方法研究[D];哈尔滨工业大学;2010年
3 关晓薇;基于语义语言的机器翻译系统中若干关键问题研究[D];大连理工大学;2009年
4 薛永增;统计机器翻译若干关键技术研究[D];哈尔滨工业大学;2007年
5 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
6 武斌;面向俄文信息处理的机器翻译实验研究[D];中国人民解放军外国语学院;2007年
7 陈毅东;基于短语的统计机器翻译模型若干关键技术研究[D];厦门大学;2008年
8 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
9 刘楠;视频广告内容分析与理解[D];北京交通大学;2012年
中国硕士学位论文全文数据库 前10条
1 任宣映;汉韩语言比较及基于规则的汉韩机器翻译系统研究[D];清华大学;2004年
2 朱海;基于混淆网络的机器翻译系统融合研究[D];中国科学技术大学;2010年
3 赛依旦·阿不力米提;基于WCF的维汉词典及机器翻译系统的设计与实现[D];新疆大学;2012年
4 胡永久;一个英汉机器翻译系统的研究与实现[D];四川大学;2005年
5 周云;汉语越南语机器翻译实验系统[D];中国人民解放军外国语学院;2006年
6 秦少康;英语词汇歧义及英汉机器翻译中词义消歧上下限研究[D];厦门大学;2006年
7 张润延;海量语言模型的研究及其在机器翻译中的应用[D];厦门大学;2009年
8 赵欣;基于双语命名实体识别的词汇对齐和机器翻译研究[D];厦门大学;2009年
9 孙娟;基于Web服务的多引擎机器翻译系统[D];中国海洋大学;2005年
10 吉日木图;基于模板的英蒙机器翻译系统的研究[D];内蒙古大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026