收藏本站
《中国人民解放军外国语学院》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

俄语军事文本的局部语义分析

周翰博  
【摘要】: 近年来,随着计算技术的迅速发展,尤其是国际互联网的普及,人类社会的信息化程度越来越高。面对浩如烟海的信息,人们迫切希望在计算机上建立起一套能够理解人类自然语言的系统,以便进行快速、有效的信息处理。于是,以自然语言的自动化处理为主要研究内容的计算语言学就成为一门重要的新兴学科。这门学科的最终目的是要使计算机能够像人那样理解自然语言的语义。为了达到这个目标,对自然语言进行语义分析并研制语义算法就势在必行。实际上,自然语言文本的语义处理已经成为信息技术领域最迫切的任务之一。然而,从总体上看,语义分析技术还远不如语法分析、形态分析技术那样成熟,它尚处于探索的阶段。 面向计算机的语义分析方法有很多种,但不管采用哪种方法都需要解决两个重要的问题:知识的获取以及句子的语义表征。总体而言,知识的获取方式主要包括从语义词典中获取和从大规模真实文本中获取这两种;句子语义的表征就是要把自然语言的语义信息映射为一种计算机能够理解的语义中介语。知识的获取方式直接决定了语义表征的方法和结果。本文将着重讨论基于语义词典的文本语义分析技术,这种方法最重要的两个环节就是设计语义语言和建立语义词典。 本文的研究任务是利用语义分析技术实现对俄语军事文本的局部语义分析。为此,我们首先从理论上论证了对军事文本进行语义分析的可行性,然后用具体实例展示分析的结果,由此彰显军事文本语义分析技术的可操作性。 我们期望此项研究能够有助于推动俄文信息计算机处理技术的相关理论问题的深入探讨,同时为俄语军事文本自动处理系统的设计与研发提供一些有益启示,这正是本文研究的理论意义和实用价值所在。 本文研究的新意:首次运用局部语义分析技术处理俄语军事文本,将有助于为此类特殊文本的计算机处理提供一些新思路;通过论述自然语言的函数性,将对解决自然语言语义信息的形式化问题探索新的途径;从理论与应用两个方面论证俄语军事文本计算机处理的必要性和可行性,将为研制开发满足军队信息化建设需求的自然语言处理系统奠定较为坚实的基础;此外,文中还阐述了词汇语义编码和语义知识库建设的基本方略,以及在实用系统中嵌入人机对话模块以提高计算机处理性能的新见解。 论文由绪论、第一章、第二章、第三章、第四章和结论六部分组成。 绪论绪论部分首先概述在当今信息化时代自然语言处理技术的重要作用和地位,并简要描述本文所要研究的对象;然后论述自然语言处理的关键概念、工作流程、语义分析的地位、局部语义分析技术的特点及其应用等问题;最后对本文的研究对象——俄语军事文本的定义和特点以及选题动机加以扼要说明。 第一章简述传统的语义分析技术这一章共分三节。首先,在概述部分根据获取知识的方式不同,将语义分析技术分为两类:经验主义和理性主义;随后考察语义分析技术的发展简史,简要剖析语义网络文法理论、逻辑表示语义理论、义素分析法、优选语义学、蒙塔格语法以及格语法等多种常见的语义分析方法,指出上述理论方法各自的优势与不足以及对于本文研究的启示;最后重点介绍俄罗斯的语义分析技术研究现状与应用前景。 第二章语义语言语义语言是整个语义分析系统的理论基础。作为本文的重点章节,本章首先从计算机能否“理解”文本这一问题入手,分析语义语言在自然语言处理过程中的重要性及相关概念和特点;接着详细介绍语义语言的核心部分——基元函项,包括基元函项的概念、结构,常见的基元函项列表、基元函项中的辅助符号、句法信息的形式化描写方法,以及常见的时间函项、地点函项和逻辑函项的意义及其表达方法;最后论述语义语言的基础,即句法语义和词类语义的表征方法。 第三章语义词典语义词典是整个语义分析系统的物质基础。本章分4小节论述语义词典的结构和内容:首先介绍现在比较流行的词汇语义资源研发技术,重点介绍《俄语词汇信息库》的内容和结构;然后从编纂语义词典的起点——词类语义入手,介绍各种词类在语义词典中的描写方法;最后着重介绍俄罗斯学者图佐夫研制的语义词典的语义层级结构和语义类别编码体系,并通过实例论证这种编码体系的优越性。 第四章基于词典的语义分析器语义分析器是最终实现语义分析的工具。本章包括4个小节:首先,介绍语义词典的使用方法,指出在实际使用中语义词典被分解成语义-句法词典和语用词典两部分;接着,重点论述语义分析器对句子进行局部语义分析的过程,包括形态分析、逐词预处理、句子的组配三个步骤;然后从理论上说明语义分析器的应用范围,继而以军事文本语句为例,按照上述步骤对其进行语义分析,演示语义分析的全过程以及各分析步骤所得出的结果。 结论综括全文的理论探索与实验模拟,我们得出以下4点认识:1)自然语言具有一定的函数性质,可以采用函数的方法实现对自然语言的形式化描写;2)语义词典在语义分析系统中占有重要的位置,一个语义分析系统质量的好坏,最终由语义词典决定;3)用计算机实现对俄语军事文本语句进行局部语义分析不仅具有重要的学术意义,而且具有广泛的实际应用价值;4)完全依靠计算机对文本进行语义处理的结果可能并不理想,应当在系统中添加人机对话的模块,以提高文本语义分析的性能。 致谢: 在论文的选题、撰写直到最后的定稿过程中,我的导师易绵竹教授认真指导,多次提出修改意见,对论文的质量要求甚严,倾注了大量的心血。导师对本学科研究热点的准确把握以及丰硕的研究成果,使本人在论文的撰写过程中受益匪浅;同时,他严谨的治学态度,精益求精的工作作风使我深受感动,成为我终生受用的财富。在此对尊敬的导师表示感谢。 此外,郅友昌教授在论文的选题以及修改过程中提出了宝贵的意见,教育部语言文字应用研究所计算语言学研究室研究员冯志伟先生、中国科学院HNC研究院院长晋耀红博士及北京师范大学中文信息处理研究所苗传江博士对论文的结构、内容和论证方法等方面都提出了宝贵的建议,在此一并表示感谢。
【学位授予单位】:中国人民解放军外国语学院
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:H35

【参考文献】
中国期刊全文数据库 前10条
1 刘江雪;语义分析与英语学习词典[J];抚州师专学报;1998年04期
2 冯志伟;自然语言处理的学科定位[J];解放军外国语学院学报;2005年03期
3 易绵竹;从计算语言学角度看语义角色问题[J];解放军外语学院学报;1998年04期
4 张普;信息处理用现代汉语语义分析的理论与方法[J];中文信息学报;1991年03期
5 刘东立,唐泓英,王宝库,姚天顺;汉语分析的语义网络表示法[J];中文信息学报;1992年04期
6 黄曾阳;HNC理论概要[J];中文信息学报;1997年04期
7 易绵竹,薛恩奎,李民;网络背景下语言信息处理的理论研究[J];外语学刊;2000年02期
8 卢植,伍乐其;自然语言元语言论与语义分析[J];外语学刊;2002年04期
9 侯志霞,曹军;自然语言处理的发展概况及前景展望[J];山东外语教学;2003年05期
10 桂诗春;潜伏语义分析的理论及其应用[J];现代外语;2003年01期
中国博士学位论文全文数据库 前1条
1 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
【共引文献】
中国期刊全文数据库 前10条
1 赵欣欣;索红光;刘玉树;张利萍;;基于带权语义距离的网页预取方法[J];北京理工大学学报;2006年08期
2 于一;廖睿;叶大田;;电子病历结构化方法概述[J];北京生物医学工程;2007年01期
3 周红;自然语言理解中的语义分析问题[J];滨州师专学报;2001年03期
4 索东梅;自然语言理解研究[J];长春师范学院学报;2005年02期
5 萧国政;胡惮;;信息处理的汉语语义资源建设现状分析与前景展望[J];长江学术;2007年02期
6 伍莹;;基于“词群—词位变体”理论的现代汉语形容词语义网络构建——以“胖”类形容词为例[J];长江学术;2011年02期
7 林鹏,李祖枢,刘朝涛,曹志娟;自然语言处理与情报检索[J];重庆工业高等专科学校学报;2004年04期
8 高元梓;;基于CEF和WordNet的词汇拓展框架的构建[J];重庆文理学院学报(社会科学版);2010年03期
9 燕莉;岳好平;;关于自然语义元语言论语义解释的思考[J];长沙大学学报;2010年06期
10 于屏方;动词义位中内化的概念角色在词典释义中的体现[J];辞书研究;2005年03期
中国重要会议论文全文数据库 前10条
1 邢富坤;宋柔;;自动词性标注中语法因素和词汇因素对英汉语的不同影响[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 初敏;;人机对话系统工程[A];信息科学与微电子技术:中国科协第三届青年学术年会论文集[C];1998年
3 陈群秀;;现代汉语实词词汇语义知识的研究和实现[A];第六届汉语词汇语义学研讨会论文集[C];2005年
4 苏新春;王惠;卢伟清;秦少康;;语言知识库的内化与细化——完善词义知识库之设想[A];第六届汉语词汇语义学研讨会论文集[C];2005年
5 王惠;苏新春;;XHK基于语法知识的汉语词义描述[A];第六届汉语词汇语义学研讨会论文集[C];2005年
6 徐德宽;;现代汉语双宾构造中两个宾语的题元角色[A];第六届汉语词汇语义学研讨会论文集[C];2005年
7 李晋霞;;面向计算机的“V_双+N_双”结构类型研究[A];语言文字应用研究论文集(Ⅱ)[C];2004年
8 贺前华;徐秉铮;;神经网络在汉语自动分词中的应用[A];第二届全国人机语音通讯学术会议论文集[C];1992年
9 陈慧清;林世平;;基于知网和模式自举的概念间分类关系获取方法[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
10 晋耀红;;汉语句蜕处理[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 王春秀;现代俄语同义词研究[D];上海外国语大学;2010年
2 徐莉娜;翻译中句子结构转换研究[D];上海外国语大学;2010年
3 张世宁;广义量词理论研究[D];南开大学;2010年
4 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
5 格根哈斯;蒙古语科尔沁土语特殊词汇研究[D];中央民族大学;2011年
6 冀芳;济宁方言义位研究[D];山东大学;2011年
7 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
8 肖珊;基于概念语义的言说动词系统研究[D];武汉大学;2011年
9 郭鸿志;多源语义知识库融合方法研究[D];哈尔滨工业大学;2011年
10 王迈;语言形式化原理[D];上海外国语大学;2011年
中国硕士学位论文全文数据库 前10条
1 李瑛;汉朝双语语义启动效应的研究[D];南京医科大学;2009年
2 吴艺彬;俄语三价动词的语义配价与句法模式[D];哈尔滨师范大学;2010年
3 任芝;请求言语行为的俄英对比研究[D];上海外国语大学;2010年
4 王洋;基于潜在语义分析的智能搜索技术研究[D];哈尔滨工程大学;2010年
5 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
6 徐思强;脑认知状态分类识别方法的研究和应用[D];大连理工大学;2010年
7 吕韶华;面向中文评论文本的情感倾向性研究[D];大连理工大学;2010年
8 邢鑫岩;基于序列模型的情感分析研究[D];大连理工大学;2010年
9 刘金凤;面向自然语言处理的汉语句子语义知识库构建研究[D];鲁东大学;2009年
10 王阿婷;基于概念集合的网页内容过滤方法的研究[D];北京交通大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱靖波,姚天顺;词义自动消歧概率模型[J];东北大学学报;2000年05期
2 鲁川,林杏光;现代汉语语法的格关系[J];汉语学习;1989年05期
3 周会平,王挺,陈火旺;汉英翻译系统ICENT的中间语言设计[J];计算机研究与发展;2000年03期
4 张永奎,张国清;基于义类同现频率的汉语语义排歧方法[J];计算机研究与发展;1999年07期
5 齐璇,马红妹,陈火旺;汉语的语义分析研究[J];计算机工程与科学;2001年03期
6 林杏光;正确引导汉语理解与汉语研究──事关人工智能开发的一个重要前提[J];科技导报;1997年04期
7 张潮生;语义表达的一些性质[J];中文信息学报;1991年01期
8 刘东立,唐泓英,王宝库,姚天顺;汉语分析的语义网络表示法[J];中文信息学报;1992年04期
9 李涓子,黄昌宁,杨尔弘;一种自组织的汉语词义排歧方法[J];中文信息学报;1999年03期
10 詹卫东,常宝宝,俞士汶;汉语短语结构定界歧义类型分析及分布统计[J];中文信息学报;1999年03期
【相似文献】
中国期刊全文数据库 前10条
1 本刊记者;;2003自然语言处理与知识工程国际会议将在中国北京举行[J];语言科学;2003年03期
2 秦玮远;;自然语言中副语言的逻辑处理[J];现代语文(语言研究版);2007年07期
3 冯志伟;;自然语言处理中的一些宏观问题之我见[J];中国外语;2009年05期
4 陈肇雄,王英姿;我国智能型机器翻译研究获重要成果[J];中国科学基金;1997年03期
5 常宝宝;;自然语言分析与生成术语简介[J];术语标准化与信息技术;2010年04期
6 张禄彭;;面向自然语言处理的歧义概念[J];解放军外国语学院学报;2007年05期
7 田怀凤;;基于多策略的专业术语抽取处理技术的研究[J];计算机与现代化;2008年12期
8 李海艳;;语义距离的计算与感知[J];法国研究;2010年03期
9 徐臻;;试论语言工程的开发[J];黑龙江高教研究;1984年02期
10 吕西安·马尔柰夫,保尔·若利昂;简论自然语言处理的连接网络法[J];中文信息学报;1997年02期
中国重要会议论文全文数据库 前10条
1 支流;段慧明;朱学锋;俞士汶;;中文缩略语知识库建设[A];第三届学生计算语言学研讨会论文集[C];2006年
2 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
4 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 刘开瑛;由丽萍;;汉语框架语义知识库构建工程[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 葛诗利;陈潇潇;;中国EFL学习者自动作文评分探索[A];第三届学生计算语言学研讨会论文集[C];2006年
8 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 杨丽鹏;林世平;;基于关联规则和自然语言处理技术的概念间非分类关系的抽取[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
10 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
中国重要报纸全文数据库 前10条
1 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
2 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
3 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年
4 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
5 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
6 沈建缘;洪小文:时尚科学家[N];经济观察报;2009年
7 记者 刘传书;微软在深圳设实验室[N];科技日报;2006年
8 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
9 ;开天辟地第一回[N];计算机世界;2002年
10 刘洁;SAS分析产品链增添“新成员”[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
2 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
3 浑洁絮;基于语义语言的英汉机器翻译研究[D];大连理工大学;2011年
4 代印唐;基于语义网络的知识协作关键技术研究[D];复旦大学;2009年
5 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
6 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
7 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
10 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 周翰博;俄语军事文本的局部语义分析[D];中国人民解放军外国语学院;2007年
2 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
3 张峰;基于自然语言处理的自动文摘系统[D];电子科技大学;2006年
4 丁卓冶;中文命名实体识别的研究[D];大连理工大学;2008年
5 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
6 孙广庆;基于语义范畴扩展的词义消歧的研究[D];哈尔滨工程大学;2008年
7 侯丽敏;基于网络的智能答疑系统的研究与实现[D];河南大学;2005年
8 崔昌利;俄语简单句述谓VP的模式化及自动识别[D];黑龙江大学;2005年
9 赵城利;基于Web的信息智能感知技术及应用[D];国防科学技术大学;2004年
10 张学;EBMT系统中翻译模板的抽取与匹配[D];大连理工大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026