收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

汉语语义知识的表示及其在汉英机译中的应用

齐璇  
【摘要】: 本文研究了自然语言处理的语义层面,提出了汉语语义知识的表示和获取方法,并将汉语语义知识应用到一个基于中间语言的汉英机器翻译系统ICENTII中。 语义分析是自然语言理解的基础。本文在比较了各种语义学理论、各种知识表示方法和现有语义资源的基础上,提出并建立了基于框架的汉语语义知识的层级表述体系,体系由语义原语、义项、语义块三级语义单位和语义规则构成。语义原语是最基本的语义单位,用来描述语义特征;义项表示概念,用语义原语描述;语义块表示复合概念,用嵌套的框架结构描述。在语义框架中,由语义角色定义了各语义成分之间的语义关系。语义规则是组合性语义知识的抽象,由合式语义链和生成块模板两部分构成。合式语义链反映了语义约束知识,即什么样的语义单位可以组合在一起;生成块模板表示了由合式语义链组合在一起的语义单位可生成的新成分的语义结构,其中语义角色刻画了结构中各成分之间的语义关系。在建立了语义知识的表述体系后,本文设计并实现了语义规则的获取算法。在搭配实例语料中,经由统计的方法自动学习获得合式语义链,再由半自动的方式获取生成块模板,得到语义规则。 在建立了汉语语义知识的表述体系并获取了语义规则后,本文将语义知识应用于基于中间语言的汉英机译系统ICENT中,实现了ICENTII系统。 ICENTII系统也是基于中间语言的翻译系统,汉语分析的所有结果都表示在中间语言中,英语生成所需的信息也都从中间语言中获得。因此,中间语言是系统设计的关键。本文在分析了汉语和英语的各种语言现象后,设计并实现了一种基于句法语义的中间语言,用嵌套的框架结构表示。框架中包含一组槽值对,用来说明各种句法语义属性。ICENTII系统的中间语言突出了语义属性的表示,包括词的义项描述和短语、句子的语义关系描述。ICENTII系统的中间语言综合了句法和语义信息,在表示能力和实现复杂性之间进行了权衡,概念粒度适中,表示清楚,实现简单。ICENTII系统的中间语言遵循渐进的开发方法,在系统设计的过程中不断完善。实验证明,该中间语言表示能满足翻译的需要。 ICENTII系统工作的第一步是分词和标注,本文设计并实现了一个语义自动标注算法,对分词结果进行义项的自动标注。标注过程对单义词、多义词和未识别词分别进行处理,利用句法和语义知识确定义项标注集合。语义标注的结果可能不唯一,在语义分析阶段将进一步进行词义的消歧。若义项标注集合中包含正确的义项,则语义标注命中;若义项标注集合有且仅有正确的义项,则语义标注准确。经实验证明,该算法可以达到很高的命中率和较高的准确率,而且命中集合的大小也比较小。 句法和语义是形式和内容的关系,密不可分。本文在汉语的分析中实现了句法分析和语义分析的结合。汉语的分析采用扩展的上下文无关文法,每一条句法产 国防科学技术大学研究生院学位论文 生式都对应一个前提判断函数。当分析器要用句法产生式进行归约时,首先激活 前提判断函数,在其中调用相应的语义分析模块进行语义分析,只有通过语义分 析才可以进行归约,否则当前分析不正确,可以终止。在进行规约时,不但产生 了新的句法结构,还生成了与之对应的语义结构。因此,在ICENTll系统的汉语 分析中,语义分析引导了分析器的动作。 歧义是自然语言的一大特点,词汇歧义和句法歧义的消解仅通过句法知识难以 解决。本文提出了一种利用语义知识消歧的策略,在汉语的语义标注阶段,利用 合式语义链进行词汇歧义的消解;在汉语的语义分析阶段,利用语义规则的匹配 和生成块可生成性的判定进行词汇歧义的进一步消解和句法歧义的消解。利用语 义知识消歧的方法产生了比较满意的结果。 本文的最后总结了全文,井指出了下一步的研究工作。 本文的工作把汉语的分析从句法层面深入到语义层面,建立了完整的、系统的 语义知识表示,并把获取的语义知识应用到汉英机译系统ICENTll的各个阶段中。 经过对实验语料的翻译,取得令人满意的结果。本文的工作将对进一步的研究工 作奠定良好的理论和实践基础。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 CSDN;;微软中间语言和即时编译[J];程序员;2002年04期
2 陈涵生;陈宇能;;Ada程序设计环境的中间语言DIANA[J];计算机应用与软件;1986年05期
3 李筱青,陈晖,陈意云;一种新型类型化中间语言的优化实现技术[J];计算机工程;2005年05期
4 秦青文;王戟;孙旭光;梅文华;;基于IDA-Pro的软件逆向分析方法[J];计算机工程;2008年22期
5 胡燕武,白光野;中间语言X-code的设计思想[J];计算机学报;1983年02期
6 陈欣荣,孟红霞;易于移植的测试图形程序编译器[J];计算机辅助设计与图形学学报;1997年04期
7 陈凯明,刘宗田,任传胜;逆编译中面向用户的中间语言设计和实现[J];小型微型计算机系统;2002年10期
8 恽纪昌;安振庄;;ATLAS语言介绍[J];电子测量技术;1983年03期
9 申利民,唐勇,柯汉水,陈晓谦;基于中间语言的逆编译方法[J];燕山大学学报;1997年01期
10 戴志锋;管建和;;C#中属性定义value参数的值传递机制分析[J];电脑编程技巧与维护;2007年09期
11 张涛;李迅波;;软PLC的转换中间语言模型的建立与研究[J];微计算机信息;2007年35期
12 王俊龙;宁涛;郑国磊;;基于中间语言的通用后置处理系统[J];机械工程师;2009年01期
13 洪青阳,李堂秋,杨晓峰;汉英机译系统英文生成中特殊动词短语的处理研究[J];计算机应用研究;2001年03期
14 杨放春;陈俊亮;;SDL/GR中间语言的设计方法[J];北京邮电大学学报;1990年04期
15 陈凯明,刘宗田,王武荣,叶勇;符号执行过程的DFA和CFA[J];计算机工程;2002年11期
16 杨艳萍;谭庆平;;Web服务自动语义标注的本体定位方法研究[J];计算机工程与科学;2008年04期
17 曾诚;李兵;何克清;;KMP算法在Web服务语义标注中的应用[J];微电子学与计算机;2010年08期
18 徐爱萍;边馥苓;;基于语义查询树的GIS中文查询语句向SQL的转换[J];武汉大学学报(信息科学版);2006年10期
19 徐爱萍;边馥苓;;GIS中文查询的中间语言向SQL语句的转换[J];计算机工程;2006年22期
20 张瑜;李景;孟宪学;苏晓路;;网络标注的主要方法概述[J];图书情报工作;2008年01期
中国重要会议论文全文数据库 前10条
1 宋炜;;语义知识获取与网络信息集成的分析[A];信息科学与微电子技术:中国科协第三届青年学术年会论文集[C];1998年
2 杨柳;何婷婷;涂新辉;;基于网络百科全书的中文关联语义知识获取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 熊文新;;提升自然语言向中间语言转换准确性的增强处理[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 董娜;林碧琴;丁丰;;机器翻译中若干问题的探讨[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
5 杨晓峰;李堂秋;洪青阳;;汉英机器翻译系统中的一种词义排歧方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 吴晨;张全;贾宁;;一种基于概念的信息检索方法(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
7 范开泰;由丽萍;刘开瑛;;汉语框架语义分析系统研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 陈波;姬东鸿;孙程;吕晨;;基于特征结构的汉语主谓谓语句语义标注研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 袁柳;李战怀;陈世亮;;OntoWord:一种新的Web页面语义标注方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
10 吕国英;冯艳;李茹;;基于中文框架语义的信息抽取研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前10条
1 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
2 郭鸿志;多源语义知识库融合方法研究[D];哈尔滨工业大学;2011年
3 梁汝鹏;基于语义标注的地理信息服务关键技术研究[D];解放军信息工程大学;2013年
4 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
5 刘海学;基于语义标注的元数据自动构建及其相关技术研究[D];华东师范大学;2010年
6 陈凯明;逆编译中几项关键技术研究[D];合肥工业大学;2004年
7 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
8 虎晓红;用于图像检索的语义标注技术的研究[D];中国矿业大学(北京);2010年
9 李赟;基于中文维基百科的语义知识挖掘相关研究[D];北京邮电大学;2009年
10 熊华;视频内容结构化技术的研究与实现[D];中国人民解放军国防科学技术大学;2001年
中国硕士学位论文全文数据库 前10条
1 马德华;基于语义知识的监控执行模式设计与实现[D];吉林大学;2013年
2 黄文;三维模型语义标注系统的设计与实现[D];西北大学;2011年
3 常建峰;基于模糊支持向量机的图像语义标注[D];太原理工大学;2011年
4 徐利谋;基于语义的Web服务发现研究[D];湖南工业大学;2008年
5 罗旋;基于复句领域本体的语义标注方法研究[D];华中师范大学;2006年
6 唐炳玲;基于语义知识框架的AUVs群体协同环境感知与使命控制[D];哈尔滨工程大学;2013年
7 张磊;基于中文维基百科的全文语义标注系统[D];华中科技大学;2012年
8 朱海霞;基于AIE的半自动Web页标注关键技术研究[D];河海大学;2005年
9 王浩然;海洋文献元数据的语义标注技术研究[D];中国海洋大学;2008年
10 高永岗;医学图像的语义标注技术研究与应用[D];西北大学;2009年
中国重要报纸全文数据库 前10条
1 福建 忠英;手机翻译时代的到来[N];电脑报;2004年
2 南京邮电学院 李建忠;“Hello,World!”程序[N];计算机世界;2002年
3 南京邮电学院 李建忠;Microsoft.NET平台[N];计算机世界;2002年
4 闫宏志;全文翻译技术发展脉络[N];中国计算机报;2003年
5 周蓉蓉;为“方言”选择合适的翻译[N];计算机世界;2002年
6 中国科学院自动化研究所 徐波;回归到“通天塔”之前[N];计算机世界;2002年
7 南京邮电学院 李建忠;留住Windows开发者[N];计算机世界;2002年
8 剑鸣;让AJAX开发更加简单完善[N];计算机世界;2006年
9 清水 编译;新一代用户界面框架WPF[N];计算机世界;2006年
10 张莉;在Linux和Mac OS上开发.Net应用[N];计算机世界;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978