收藏本站
《中国人民解放军国防科学技术大学》 2002年
收藏 | 手机打开
二维码
手机客户端打开本文

汉英机器翻译中汉语上下文语境的表示与应用研究

马红妹  
【摘要】: 本文面向汉英机器翻译,研究了汉语上下文语境的表示与应用,并将研究成果应用于汉英机译系统ICENT中。 在汉语句法分析和语义分析的基础之上,本文建立了汉语上下文语境模型CCM(Chinese Context Model,CCM)。CCM包括上下文语境知识的表示、获取和管理三个部分,构成了一个知识系统。依据上下文语境的动态变化性,CCM采用一种结构化的语义网络表示上下文语境知识,称为概念信息体关联网络CIURN(Concept Information Unit Relation Network,CIURN),并建立了动态获取上下文语境知识以及动态地管理和维护上下文语境知识的机制。CCM具有系统性、实用性、动态性、结构性和可扩充性的特点,其上下文语境知识包含句法信息、语义信息和句子之间的连贯信息,为分析汉语句子与上下文语境的关系提供了较好的支持。CCM将汉语上下文语境知识的获取与汉语分析纳入了同一个体系,建立了一种汉语上下文语境表示与应用的基本模式。 基于汉语上下文语境模型CCM,本文研究了汉语事件时间信息的分析、主语省略句的处理和名词短语的定指性判定问题。 本文建立了汉语事件时间信息框架TIFCE(Temporal Information Frame of Chinese Event,TIFCE),采用时制和时体两个元素描述了汉语事件的时间信息。基于CCM提出并实现了一种汉语事件时间信息分析方法,处理了汉语时间引用现象,获得了汉语事件的时间信息。该方法通过分析汉语时间短语的时间信息与时制,借助时间短语与事件之间的时间管辖关系,获得了汉语事件的时制;同时通过与汉语事件时体模板进行模式匹配获得了事件的时体。为给英语动词时态的正确生成提供信息,本文建立了汉英时间信息转换映射毛,将TIFCE中汉语事件的时间信息映射为英语动词的时态。通过对简化的新闻报道类汉语篇章语料进行实验,取得了较好的实验结果。 汉语篇章中主语省略现象给英语译文的主语以及其它句法成分的正确生成带来了许多困难,为此本文基于CCM提出并实现了一种汉语主语省略句处理方法。处理过程分为主语省略的识别和主语省略的恢复,提出了一种在汉语句子语义结构中识别主语省略的方法和一种从句法、语义和上下文语境多方面综合判断的“候选-选择”主语省略恢复策略。在实验语料中取得了较好的分析结果。 为判定汉语篇章中名词短语是否定指,为给英语译文冠词的正确生成提供信息,本文基于CCM提出并实现了一种汉语名词短语定指性判定方法。本文确立了汉语名词短语间的定指关系,提出了一种“候选-比较”汉语名词短语间定指关系建立方法,进而判定了名词短语的定指性。实验在名词短语为特指的条件下判断其定指性,验证了方法的有效性。 通过应用汉语上下文语境模型CCM及有关上下文分析方法,本文扩充了基于 国防科学技术大学研究生院学位论文 中间语言的汉英机译系统ICENT。原有系统主要以单句为对象进行句法分析和语 义分析,扩充后的ICENT系统可对汉语句子进行上下文分析,其上下文分析分为 三个子系统:时间信息分析子系统、主语省略处理子系统和名词短语定指判定子 系统,主要解决英语动词时态的生成、省略主语的确定和定冠词的添加等问题。 通过对ICENT系统原有中间语言进行扩充,在中间结构中表示了上下文分析结果, 为英语生成提供了上下文语境信息。 本文建立了汉语上下文语境模型,研究了汉语事件时间信息的分析、主语省略 句的处理以及名词短语定指性的判定问题,并基于上下文语境模型提出和实现了 相应的上下文分析方法,取得了较好的实验结果。目前,这些上下文分析方法还 只是在受限语料中进行了测试。在今后的研究工作中,我们将对汉语篇章语言现 象及其分析方法继续进行深入的研究,进一步扩大适用语料范围,提高汉英机器 翻译译文的质量。
【学位授予单位】:中国人民解放军国防科学技术大学
【学位级别】:博士
【学位授予年份】:2002
【分类号】:TP391.2

【引证文献】
中国期刊全文数据库 前1条
1 林达真;李绍滋;;基于模式分类的汉语时态确定方法研究[J];中文信息学报;2006年01期
中国重要会议论文全文数据库 前1条
1 林达真;李绍滋;;基于模式分类的汉语时态确定方法研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
中国博士学位论文全文数据库 前1条
1 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
【参考文献】
中国期刊全文数据库 前10条
1 麻志毅,林鸿飞,姚天顺,马佳琳;基于情境的文本中的时间信息分析[J];东北大学学报(自然科学版);1999年03期
2 刘海军,黄河燕,陈肇雄;智能机器翻译系统中的语境处理[J];计算机研究与发展;1998年04期
3 马红妹,王挺,陈火旺;汉语篇章时间短语的分析与时制验算[J];计算机研究与发展;2002年10期
4 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
5 宋柔;汉语叙述文中的小句前部省略现象初析[J];中文信息学报;1992年03期
6 郑杰,茅于杭,董清富;基于语境的语义排歧方法[J];中文信息学报;2000年05期
7 瞿宗德;汉语中主语隐现句及其英译[J];上海海运学院学报;1997年02期
8 张益民,陆汝占,沈李斌;一种混合型的汉语篇章结构自动分析方法[J];软件学报;2000年11期
9 周会平,王挺,陈火旺;用LR算法分析汉语的语法关系[J];软件学报;1999年09期
10 陈脑冲;论“主语”[J];外语教学与研究;1993年04期
中国重要会议论文全文数据库 前8条
1 周强;詹卫东;任海波;;构建大规模的汉语语块库[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 马红妹;王挺;陈火旺;;汉英机器翻译中语境知识的表示与应用[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 俞士汶;;计算语言学的应用研究与基础研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 陈肇雄;黄河燕;;多语机器翻译及其系列应用系统研究进展[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
5 陆汝占;高峰;陈玉泉;靳光瑾;;汉语内涵逻辑及其应用[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 陈群秀;李坚;王健;;信息处理用现代汉语语义分类词典的设计与实现[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
7 赵铁军;李生;孟遥;黄玉;杨沐昀;;机器翻译系统中句法分析技术的研究实践[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
8 马红妹;齐璇;王挺;陈火旺;;汉英机译系统ICENT中主语省略句的处理[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前1条
1 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
【共引文献】
中国期刊全文数据库 前10条
1 杨坚定,钟莉莉;动态翻译单位探讨[J];中国翻译;2004年05期
2 何明珠;英语无动词小句的理解与翻译[J];西安外国语学院学报;2000年01期
3 鲍广宇,杨飞,刘晓明;军事文本标图系统的设计与原型实现[J];解放军理工大学学报(自然科学版);2003年03期
4 陈耀东,王挺;基于有向图的双向匹配分词算法及实现[J];计算机应用;2005年06期
5 程葳,赵军,徐波,刘非凡;一种面向汉英口语翻译的双语语块处理方法[J];中文信息学报;2003年02期
6 史树敏;机器翻译方法的研究现状[J];内蒙古师范大学学报(自然科学汉文版);2004年02期
7 俞士汶,朱学锋;关于汉语信息处理的认识及其研究方略[J];语言文字应用;2002年02期
8 陈玉忠,李保利,俞士汶,兰措吉;基于格助词和接续特征的藏文自动分词方案[J];语言文字应用;2003年01期
9 陆汝占,靳光瑾;现代汉语研究的新视角[J];语言文字应用;2004年02期
10 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
中国重要会议论文全文数据库 前10条
1 徐海;;英、汉分类词典编纂刍议[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
2 于伟昌;;汉译外来语言学术语标准化的必要性及其原则[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
3 王安民;王健;;从原型理论看外向型汉英学习词典中词目义项的编排[A];中国辞书学会双语词典专业委员会第七届年会论文集[C];2007年
4 武继红;;论学习词典中隐喻对搭配形成的影响——基于认知语义学的搭配研究[A];中国辞书学会双语词典专业委员会第七届年会论文集[C];2007年
5 余建军;;刍议英汉词典例证的翻译[A];中国辞书学会双语词典专业委员会第七届年会论文集[C];2007年
6 由立真;穆志纯;;基于GHSOM网络预测客户欺诈行为[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
7 蔡有恒;;功能理论与语篇语体特征分析[A];福建省外国语文学会2005年年会暨学术研讨会论文集[C];2005年
8 肖传芬;;从形式机制谈语篇词汇衔接[A];福建省外国语文学会2005年年会暨学术研讨会论文集[C];2005年
9 侯丽娟;;认知语义学中的原型理论及其外语教学应用[A];福建省外国语文学会2005年年会暨学术研讨会论文集[C];2005年
10 彭菲;;学术论文提要的主位推进模式分析[A];福建省外国语文学会2006年年会暨学术研讨会论文集(上)[C];2006年
中国博士学位论文全文数据库 前10条
1 黄忠廉;小句中枢全译说[D];华中师范大学;2005年
2 廖艳君;新闻报道的语言学研究:消息语篇的衔接和连贯[D];湖南师范大学;2004年
3 肖明;WWW科技信息资源自动标引的理论与实践研究[D];中国科学院文献情报中心;2001年
4 黄东晶;俄汉代词指示语对比研究[D];黑龙江大学;2001年
5 朱建生;基于知识管理的现代办公信息系统的研究[D];铁道部科学研究院;2002年
6 韩子满;文学翻译中的杂合现象[D];解放军外国语学院;2002年
7 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
8 梁敬美;“这-”、“那-”的语用与话语功能研究[D];中国社会科学院研究生院;2002年
9 高长元;基于Internet高新技术产品评价群决策支持系统研究[D];哈尔滨工程大学;2002年
10 吴云霞;万荣方言语法研究[D];厦门大学;2002年
中国硕士学位论文全文数据库 前10条
1 刘晔;汉语叙事语篇的主位分析及应用[D];吉林大学;2007年
2 罗春宏;现代汉语篇章中的总结关系连接成分[D];南昌大学;2007年
3 王倩;法庭审判问答冲突的语言研究[D];吉林大学;2005年
4 林琳;谈话类节目会话机制研究[D];华中师范大学;2005年
5 汤赛丽;常识知识问答系统中知识库构建的研究与设计[D];河南大学;2005年
6 周舫;汉语句子相似度计算方法及其应用的研究[D];河南大学;2005年
7 汪润娟;体词性时段词语的功能研究[D];东北师范大学;2005年
8 杨万鹏;论数字化翻译标准[D];武汉理工大学;2005年
9 唐锋;[D];浙江大学;2002年
10 任宣映;汉韩语言比较及基于规则的汉韩机器翻译系统研究[D];清华大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报(自然科学版);1998年01期
2 麻志毅,林鸿飞,姚天顺,马佳琳;基于情境的文本中的时间信息分析[J];东北大学学报(自然科学版);1999年03期
3 董振东,董强;知网和汉语研究[J];当代语言学;2001年01期
4 马红妹,王挺,陈火旺;汉语篇章时间短语的分析与时制验算[J];计算机研究与发展;2002年10期
5 胡俊华,杨波,李金屏;自然语言理解研究略述[J];济南大学学报(社会科学版);2001年05期
6 刘贵龙,宋柔,王慧玲;模糊聚类分析在文本分类中的应用[J];计算机工程与应用;2003年09期
7 孔祥勇,张冬茉;一种信息抽取系统中汉语同指消解算法[J];计算机工程;2003年16期
8 莫孙冶,林嘉宜,彭宏;基于模糊集的不确定时间的表示及时态关系[J];计算机工程;2005年18期
9 马红妹,齐璇,王挺,陈火旺;汉英机器翻译中汉语篇章时间信息系统模型[J];计算机工程与科学;2002年04期
10 刘贵龙;模糊近似空间上的粗糙模糊集的公理系统[J];计算机学报;2004年09期
中国重要会议论文全文数据库 前1条
1 张普;;流通度在IT术语识别中的应用分析——关于术语、术语学、术语数据库的研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
中国博士学位论文全文数据库 前4条
1 李芸;信息科学和信息技术术语概念体系研究[D];北京语言文化大学;2003年
2 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
3 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
4 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前4条
1 贾爱平;科技文献中术语定义的语言模式研究[D];北京语言文化大学;2002年
2 张宇翔;NKI本体理论中一些基本关系的研究[D];云南师范大学;2002年
3 吴平博;基于事件框架的主题相关文档智能检索的初步研究[D];清华大学;2004年
4 王昀;金融领域中汉语时间信息抽取的研究[D];清华大学;2004年
【二级引证文献】
中国重要会议论文全文数据库 前1条
1 王强军;张莉;张普;;面向术语提取和定义识别的评测语料库建设[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 胡俊峰,俞士汶;唐宋诗之计算机辅助深层研究[J];北京大学学报(自然科学版);2001年05期
2 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
3 俞士汶;中文输入中语法分析技术的应用[J];中文信息学报;1988年03期
4 宋柔;汉语叙述文中的小句前部省略现象初析[J];中文信息学报;1992年03期
5 赵铁军,李生,周明;一种生成复杂特征集句法树的汉语句法分析方法与系统实现[J];中文信息学报;1992年04期
6 俞士汶,朱学锋,段慧明;大规模现代汉语标注语料库的加工规范[J];中文信息学报;2000年06期
7 赵铁军,吕雅娟,于浩,杨沐昀,刘芳;提高汉语自动分词精度的多步处理策略[J];中文信息学报;2001年01期
8 俞士汶,朱学锋,王惠;《现代汉语语法信息词典》的新进展[J];中文信息学报;2001年01期
9 刘岩斌,俞士汶,孙钦善;古诗研究的计算机支持环境的实现[J];中文信息学报;1997年01期
10 穗志方,俞士汶,罗凤珠;宋代名家诗自动注音研究及系统实现[J];中文信息学报;1998年02期
中国重要会议论文全文数据库 前4条
1 杨沐昀;赵铁军;于浩;;自底向上的汉语句法标注体系设计与实践[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 孟遥;黄玉;赵铁军;李生;;一个包含复杂特征的统计英语句法分析模型[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 俞士汶;段慧明;朱学锋;;语言工程中同形及兼类词语的处理策略[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 马红妹;王挺;陈火旺;;汉英机器翻译中语境知识的表示与应用[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前1条
1 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 ;《汉英机器翻译若干关键技术研究》由清华大学出版社出版[J];中文信息学报;2009年02期
2 张萍;;文学创作中语境的作用[J];东南传播;2007年12期
3 王佳存;充满挑战的机器翻译技术[J];科技信息;1999年02期
4 马红妹,王挺,陈火旺;汉语篇章时间短语的分析与时制验算[J];计算机研究与发展;2002年10期
5 米海涛;赵红梅;刘群;;第十二届机器翻译峰会和NIST2009机器翻译评测研讨会简介[J];中文信息学报;2009年06期
6 王佳存;论信息化时代的汉英英汉机器翻译研究[J];科学与管理;1999年02期
7 ;计算机检索、机器翻译[J];电子科技文摘;2003年01期
8 黄河燕,陈肇雄;汉英机器翻译的英文词形态生成[J];软件学报;1997年09期
9 胡景凡,周锡令;受限汉语与汉英机器翻译系统[J];计算机工程与应用;2000年11期
10 马红妹,齐璇,王挺,陈火旺;汉英机器翻译中汉语篇章时间信息系统模型[J];计算机工程与科学;2002年04期
中国重要会议论文全文数据库 前10条
1 马红妹;王挺;陈火旺;;汉英机器翻译中时间短语的分析与时制计算[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
2 池哲洁;池毓焕;张全;;从迭句中辨识出三类花园幽径句[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 马红妹;齐璇;王挺;陈火旺;;汉英机译系统ICENT中主语省略句的处理[A];第一届学生计算语言学研讨会论文集[C];2002年
4 陈鄞;赵铁军;吕雅娟;于浩;;汉英机器翻译中数词的识别和翻译[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
5 刘忠;王成道;;英汉、汉英机器翻译的对等协同研究[A];第六届全国计算机应用联合学术会议论文集[C];2002年
6 马红妹;王挺;陈火旺;;汉英机器翻译中语境知识的表示与应用[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
7 傅爱平;;汉英机器翻译中汉语动结式译文的分析[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
8 李颖;池毓焕;;汉英机器翻译中要素句蜕变换初探[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
9 Jens Stephan;Jean Senellart;;SYSTRAN混合策略汉英机器翻译系统(英文)[A];机器翻译研究进展——第四届全国机器翻译研讨会论文集[C];2008年
10 刘群;张彤;;汉英机器翻译扩充词典的建造[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
中国重要报纸全文数据库 前10条
1 肖文;EMC建成全球协作研究网络[N];中国税务报;2007年
2 刘延淮贠强;利用信息智能处理技术提高专利信息利用水平[N];中国知识产权报;2007年
3 侯永波;也说“联合文化”[N];中国国防报;2008年
4 主持人 本报记者 龚丹韵;“雷文化”:网络语体的前进还是后退[N];解放日报;2008年
5 邱洪瑞;小学语文教材的几处语言问题[N];中华读书报;2007年
6 辽宁检验检疫局 刘滨;质检文化软实力初探[N];中国国门时报;2008年
7 华松波;“陨”≠“殒”[N];语言文字周报;2009年
8 于培明;药品标识非法是否购成假药[N];中国医药报;2007年
9 金 威;考研英语词汇复习要点[N];中国教育报;2003年
10 梦亦非;阿多诺的漂亮舌头[N];南方周末;2010年
中国博士学位论文全文数据库 前6条
1 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年
2 王道英;“这”、“那”的指示研究[D];上海师范大学;2003年
3 李茂叶;人文语言视域下的文学语言研究[D];浙江大学;2006年
4 关秀娟;全译语境作用机制论[D];黑龙江大学;2012年
5 王进;语言类型学的词汇语义研究维度[D];首都师范大学;2007年
6 张俊阁;明清山东方言代词研究[D];山东大学;2007年
中国硕士学位论文全文数据库 前10条
1 陈颖;语境与翻译[D];兰州大学;2006年
2 吴雪萍;从语境视角看《红字》的两个中译本[D];内蒙古大学;2010年
3 侯莹莹;上下文语境与衔接[D];山东师范大学;2005年
4 张婷婷;试析《鲁豫有约》节目中的会话特征[D];黑龙江大学;2009年
5 洪青阳;汉英机器翻译英文生成模块XMGEN的设计与实现[D];厦门大学;2001年
6 李映霏;语境在对外汉语教学中的作用[D];上海外国语大学;2007年
7 陈毅东;汉英机器翻译系统英文生成中的一种选词模型研究[D];厦门大学;2002年
8 魏瑾;基于统计的汉英机器翻译技术的研究[D];国防科学技术大学;2006年
9 乐丽萍;系统功能语言学语境观与广告语篇的翻译[D];江西师范大学;2007年
10 杨晓峰;汉英机器翻译系统中的一种语义排岐模型研究[D];厦门大学;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026