收藏本站
《华中师范大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

面向中文信息处理的复句关系词自动标识研究

舒江波  
【摘要】:复句作为汉语语法的重要实体单位,在语法学界受到较多关注,且相关理论成果较多。但是,从中文信息处理的角度来看,汉语复句的信息化处理的相关成果还较少,复句信息工程尚未取得实质性的突破和进展。究其原因,一是研究还不全面深入,现有的成果还未囊括复句信息处理的所有环节和难题;二是大多数研究成果都是面向人的,很多方法在信息处理中操作性不强;三是各个研究相对孤立,未将所有环节串联起来,形成一个有机的整体。目前,复句的信息化研究主要是分句与非分句的识别、复句层次关系的识别,而这些研究都以关系词的提取为前提。可见,一方面,关系词的自动提取是其他各项研究工作得以开展的基础;另一方面,关系词作为构成复句的一个部件,本身也需要深入研究。在这种背景下,本文以面向中文信息处理为出发点,以邢福义先生的复句理论为指导,对复句关系词的自动标识方法进行研究和探讨,并以自动机理论、形式化逻辑等为辅助手段,对关系词标识涉及的问题进行建模,对总结的规则进行形式化描述和存储,并研究基于规则的关系词自动标识的方法,已达到自动标识复句关系词的目的。 本文的研究主要从以下四个方面展开: 1、全面总结影响关系词自动标识的因素。影响关系词标识准确率的因素主要有五类,分别为:关系副词的影响,介词的影响,关系标记不同用法的影响(同形异义词、同形异构词、同形异类词的关联和非关联用法的影响),关系标记搭配的影响和关系标记隐现形式的影响。对每一类影响因素,主要分析其各自的特点,并讨论对应的处理方法和策略。 2、对标记连用现象进行深入研究。主要研究二标记连用和三标记连用时各个标记的语法语义功能和类别。对于二标记连用,归纳出矛盾类和限制类两种类型。这种类型的区分,既可以在计算机处理时减少不必要的计算,也可以作为复句分析过程中的一个切入点。三标记连用现象中,识别不同的关系词所需的方法不同,没有一个统一且粒度较细的策略,需要具体问题具体分析。 3、研究句式特点与关系词标识之间的关系。主要考察三类句式:第一、格式固定且无歧义,但语义关系不好确定导致关系词辖域确定困难的句式,称之为特殊句式;第二、扩展句式,普通的基于搭配理论的算法不能很好地处理扩展句式的关系词标识问题;第三、多重复句的普通句式,复句实例的标记序列中含有多个标记对。对于特殊句式,采用表里关联的方式将标记序列与处理结果一一对应;对于扩展句式,采用自动机理论进行建模,既保证了可操作性,又保证了对语言现象的概括性;对普通句式,主要是把问题抽象化,并转化为数学模型,利用解空间的求解来对标记序列进行处理。针对上述句式,建立规则库,并探讨了基于规则的关系词自动标识方法。 4、对部分充盈模态和非充盈模态下关系词的标识问题进行研究。文章首先对分句的语义关联理论进行了进一步地补充,提出3大类14个语义关联特征,并制定了特征分析的优先图,修正了分句语义关联度的计算方法。充盈模态下的关系标记主要考察“不是……就是……”,“虽然……但是……所以……”等。研究发现,对“不是……就是……”,可利用极值分析法处理;对“虽然……但是……所以……”,暂无较好的处理策略,需要建立常识知识库。非充盈模态下主要是对三分句句式的关系词的识别进行考察,发现从关系标记的典型和非典型属性入手,通过结合搭配知识,并利用分句的语义关联特征,可较准确地标识出各个分句中的关系词。
【学位授予单位】:华中师范大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:H146

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 贾遂民;雷利利;胡明生;;基于规则的复句关系词的自动标识[J];中文信息学报;2015年01期
2 杨进才;谢芳;胡金柱;;汉语复句关系词自动标识中规则引擎的研究[J];计算机科学;2014年S2期
3 黄昌宁;孙茂松;;中文信息处理最新成果的检阅[J];国际学术动态;1997年03期
4 ;中国中文信息学会第八次全国会员代表大会暨学会成立35周年学术会议在京成功举办[J];中文信息学报;2017年01期
5 王艳娟;;中文信息处理与汉字表征码——划时代的革命性创新技术[J];创新时代;2013年01期
6 赵贤德;;周有光关于中文信息处理的思想研究[J];常州工学院学报(社科版);2014年02期
7 杜璞;;中文信息处理的主流技术[J];科技创新导报;2009年24期
8 ;中文信息处理战略研讨会在南宁召开[J];中文信息学报;2007年04期
9 ;民族软件的基础——中文信息处理技术[J];数字与缩微影像;2003年03期
10 许嘉璐;;现状和设想——试论中文信息处理与现代汉语研究[J];中国语文;2000年06期
中国重要会议论文全文数据库 前10条
1 ;我国中文信息处理技术的发展与展望[A];科技进步与学科发展——“科学技术面向新世纪”学术年会论文集[C];1998年
2 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
3 ;前言[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 ;中科院计算所中文信息处理技术简介[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
5 李竹;;中文信息处理与现代汉语词类研究[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
6 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
7 ;中文信息处理重大成果汇报展方正集团展示内容介绍[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
8 ;863计划中文信息处理与智能人机接口基础数据库内容及其共享模式简介[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
9 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
10 陈小荷;;属性分析说略[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国重要报纸全文数据库 前10条
1 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年
2 本报记者仇方迎;“键书”输入法引起专家关注[N];科技日报;2002年
3 本报记者 毛国兵 通讯员 岚宇;亚伟速录:实现中文信息处理产业化的自主品牌[N];中国贸易报;2008年
4 张波 龙雨;中文信息处理国际学术会议在武汉大学召开[N];中国社会科学院院报;2007年
5 刘萍;我国中文信息处理技术达到新水平[N];中国电子报;2001年
6 倪光南;活力重现的中文信息处理[N];计算机世界;2001年
7 记者 韩晓玲通讯员 张波 龙雨;海内外专家聚焦中文信息处理[N];湖北日报;2007年
8 齐悦;速记界泰斗唐亚伟 获中文信息处理领域最高科技奖[N];中国质量报;2006年
9 赵雪;MP3、MP4、电子词典、数码学习机尴尬面对中文信息处理“软肋”[N];经理日报;2006年
10 马清华;义近:亲属关系词必须满足的意义条件[N];中国社会科学报;2010年
中国博士学位论文全文数据库 前10条
1 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
2 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
3 姚双云;复句关系标记的搭配研究与相关解释[D];华中师范大学;2006年
4 胡泉;基于复杂网络的汉语复句关系词搭配依存语言网及其应用研究[D];华中师范大学;2016年
5 王超;σ-自动机和低维CA[D];南开大学;2003年
6 张杰萌;无穷状态自动机序列,k-正则序列及相关问题的研究[D];华中科技大学;2016年
7 程刚;高射频自动机及供输弹机构动态特性研究[D];南京理工大学;2011年
8 韩召伟;几类基于量子逻辑的自动机的代数及逻辑刻画[D];陕西师范大学;2011年
9 刘光武;自动机状态复杂度及模型研究[D];华中科技大学;2007年
10 鲜国建;农业科技多维语义关联数据构建研究[D];中国农业科学院;2013年
中国硕士学位论文全文数据库 前10条
1 向磊;基于决策树的汉语复句关系词自动识别中规则挖掘方法研究[D];华中师范大学;2014年
2 陈江曼;复句关系词自动标识系统中规则库及其维护方法研究[D];华中师范大学;2012年
3 雷利利;复句关系词自动标识系统中规则解析器的研究[D];华中师范大学;2012年
4 刘剑锋;基于搭配关系的有标复句层次关系分析[D];华中师范大学;2015年
5 荣蕾;基于依存语法的汉语复句关系词自动标识[D];华中师范大学;2015年
6 郑印;基于关系词搭配的汉语复句依存关系的层次体系的自动构建[D];华中师范大学;2016年
7 王中华;汉语复句关系词自动标识中规则自动生成方法研究[D];华中师范大学;2013年
8 陈建雄;基于上下文意图的依存关系分析方法在汉语复句中的运用[D];华中师范大学;2018年
9 肖宇坤;基于决策树的非充盈态有标复句层次结构的构造方法研究[D];华中师范大学;2018年
10 邹艳军;基于决策树方法的汉语复句关系词自动识别[D];华中师范大学;2018年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026