收藏本站
《厦门大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

汉语隐喻识别与解释计算模型研究

杨芸  
【摘要】: 隐喻是一种认知现象,同时又是一种特殊的语言使用现象,存在于语言和思维的方方面面,是人类语言和思维的中心问题之一。对隐喻的识别与解释计算模型的研究,为我们研究自然语言理解提供了一个更加深入的、动态的视角。 本文围绕句子级别的汉语隐喻计算模型进行了深入而细致的研究。分析总结了隐喻语句表现形式特征和规律;提出了以隐喻接收者为中心的隐喻计算模式;给出了隐喻语句形式化分析方法,并建立了隐喻计算分类体系;提出并实现了一种隐喻识别方法,能够较大规模地识别不同类型的隐喻语句;提出并实现了一种新的隐喻意义获取和表述机制,能够有效针对所识别的隐喻进行字面意义的表示和真实意义的获取与解释。在此基础之上,研制了首个能完成对多种不同类型汉语隐喻的识别与解释任务的计算系统CHMeta。实验表明,本文所提出的汉语隐喻分类识别与意义解释的计算思想和方法是富有成效的。 本文首先确立了以隐喻接收者行为特征为依据的隐喻计算模式,提出“隐喻识别与理解的可分性”假设,指出人们完全有能力识别他暂时不知道意义(相似点)的隐喻。隐喻的识别是一种隐喻接收者在其基本语言能力和常识范围内对语义异常产生的条件反射,这一过程不需要进行任何形式的相似性推理。隐喻的识别从复杂的隐喻理解中分离出来。 在隐喻分类识别方面,提出了基于“隐喻角色依存模式”的形式化分析方法,并在此基础之上构建了汉语隐喻计算分类体系,包括2大系别和32种类别模式。每一种类别模式描述了一个最简的隐喻单元,模式之间可以进行相互嵌套与组合。该计算分类体系对隐喻表达的覆盖率达到95%,体现了分类结果的客观性。以此为基础,本文将复杂的隐喻识别引入模式识别的范畴,并定义了“指称异常度”和“搭配异常度”两个隐喻辨识的量化指标。具体过程是首先采用结构模式识别算法定位可疑的隐喻结构及相关词语,再通过参数计算得到可疑隐喻表达的隐喻可能性量化指标值,从而根据设定的隐喻阈值,进一步确认隐喻表达或排除非隐喻表达。识别系统在识别隐喻的同时还能完成对隐喻句的类别及句内相关隐喻成分的自动标注,从而有效地衔接了隐喻识别与后续的隐喻意义获取和解释环节的处理。实验显示了识别系统识别汉语隐喻语句的有效性,特别对新颖隐喻能做到有效的识别。 在隐喻意义获取与解释方面,以隐喻识别结果为基础,给出了隐喻角色依存表示语言和隐喻角色框架来表示隐喻字面语义。提出了“基于目标概念(本体)属性驱动的隐喻意义获取机制”,指出对于单独的隐喻句而言,其隐喻意义来源于喻体的显著认知特征和句子内部的局部语境信息。完整的隐喻意义由隐喻喻源意义和语境意义两部分组成。隐喻的理解与意义获取的过程是人们根据目标概念(本体)所具有的属性从喻源概念的特征和局部语境特征中为目标概念的属性选择合适的属性值的过程。为了实现这一隐喻意义获取机制,我们定义了目标概念属性、喻源和喻底语境特征及各自的获取算法以及基于互信息矩阵的隐喻意义映射函数。由此得到隐喻转绎意义集合及其表示,同时定义了基于隐喻转绎意义的隐喻意义表述规则,最终完成隐喻真实含义的表述输出。 本文的研究比较完整地给出了汉语隐喻分类识别与解释计算思想与方法,并实现了首个能够识别和解释大规模不同类型隐喻语句的计算系统CHMeta。本文的工作在汉语隐喻计算研究的道路中迈进了关键的一步,为隐喻计算理论和模型的深入研究和进一步发展奠定了一定的基础。
【学位授予单位】:厦门大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:TP391.1

【相似文献】
中国期刊全文数据库 前10条
1 任铭;;互联网舆情热点分析统计方法研究[J];科技促进发展(应用版);2010年06期
2 段磊;唐常杰;左劼;彭京;刘婷婷;苟驰;;Web实时环境两级过滤中文文本内容自学习算法[J];计算机科学与探索;2011年08期
3 李学俊;;基于分词算法&VSM的文本主观题自动评分算法研究[J];电脑知识与技术;2011年25期
4 张倩;;依托智能搜索引擎构建档案信息检索系统的策略研究[J];档案与建设;2011年06期
5 张泽清;;基于领域本体的语义检索技术研究[J];赤峰学院学报(自然科学版);2011年06期
6 朱祝武;;人工智能发展综述[J];中国西部科技;2011年17期
7 李西萍;;浅论数字图书馆智能化服务[J];内蒙古科技与经济;2011年13期
8 黄长伟;;自动文摘技术研究现状分析[J];中外企业家;2011年14期
9 胡风华;王磊;;基于知识库系统的智能搜索引擎研究[J];中国新技术新产品;2011年18期
10 朝乐门;;知识处理的理论基础研究[J];情报科学;2011年07期
中国重要会议论文全文数据库 前10条
1 苗传江;;HNC理论的句类[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
2 康海燕;樊孝忠;马礼;;自然语言理解的检索技术在数字图书馆中的应用[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
3 郭晨;;汉语语音技术[A];第一届学生计算语言学研讨会论文集[C];2002年
4 陈晓红;何晓洁;李一智;;自然语言理解在智能决策支持系统人机接口中的应用[A];全国青年管理科学与系统科学论文集(第2卷)[C];1993年
5 乐明;冯志伟;;RST的理论发展和工程应用综述[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 车万翔;刘挺;李生;;语义角色标注的方法与挑战[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
7 车万翔;刘挺;李生;;自动浅层语义分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 李成城;;基于修辞结构理论的自动文摘研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 乐明;冯志伟;;篇章修辞结构树库概述[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 ;HNC(概念层次网络)理论[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
中国重要报纸全文数据库 前10条
1 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
2 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
3 陆元婕;聪明的搜索引擎[N];中国计算机报;2001年
4 杨保国;中国科大研制的机器人会说话能干活[N];科技日报;2009年
5 ;国内语音合成技术“叫板”IBM[N];中国经营报;2000年
6 本报实习生 熊瑛;声声不息[N];科技日报;2000年
7 凌云;科大讯飞立志赶超IBM[N];通信产业报;2000年
8 易观网络咨询公司;引航“?”年代[N];中国计算机报;2000年
9 ;Edify公司中间件可靠、开放、易于集成[N];中国计算机报;2003年
10 陆元婕 飞侠;搜索技术发展及未来趋势[N];计算机世界;2001年
中国博士学位论文全文数据库 前10条
1 杨芸;汉语隐喻识别与解释计算模型研究[D];厦门大学;2008年
2 刘根辉;计算语用学基础理论及其应用研究[D];华中科技大学;2005年
3 张蕾;概念结构及其应用[D];西北工业大学;2001年
4 乐明;汉语财经评论的修辞结构标注及篇章研究[D];中国传媒大学;2006年
5 许中卫;基于双向搜索的ILP算法构建汉语语义自动切分系统[D];安徽大学;2006年
6 朱宏辉;基于知识驱动的拟人智能控制系统若干关键技术研究[D];武汉理工大学;2006年
7 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
8 段鹰;复杂生产系统决策若干关键技术研究[D];重庆大学;2009年
9 李晗静;基于自然语言处理的空间概念建模研究[D];哈尔滨工业大学;2007年
10 王朝霞;专利知识获取及其支持概念创新设计的方法研究[D];浙江大学;2009年
中国硕士学位论文全文数据库 前10条
1 刘海涛;基于自然语言理解的中文搜索引擎[D];河北科技大学;2011年
2 蔡霞;基于自然语言理解的个性化Web 数据挖掘系统的设计及实现方法研究[D];浙江工业大学;2003年
3 程培涛;机械产品设计领域自然语言理解中的概念从属树研究与实现[D];西安电子科技大学;2005年
4 王会彩;面向领域的自然语言理解中歧义处理、控制及其在产品设计中的应用[D];西安电子科技大学;2010年
5 焦海涛;机械设计领域自然语言理解知识库构建研究[D];西安电子科技大学;2004年
6 杨俊梅;产品设计中含有特殊动词复合句的自然语言理解的研究与实现[D];西安电子科技大学;2005年
7 李海林;自然语言理解及其在机务信息规范化中的应用[D];南京航空航天大学;2004年
8 亿珍珍;面向产品设计的自然语言理解语义分析研究[D];西安电子科技大学;2004年
9 赵亮;自然语言理解中基于本体的概念区分研究及其在智能仪器设计领域的应用[D];西安电子科技大学;2011年
10 胡树楷;机械产品设计中的自然语言理解复合句语义分析[D];西安电子科技大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026