收藏本站
《华中师范大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

面向中文信息处理的复句关系词自动标识研究

舒江波  
【摘要】:复句作为汉语语法的重要实体单位,在语法学界受到较多关注,且相关理论成果较多。但是,从中文信息处理的角度来看,汉语复句的信息化处理的相关成果还较少,复句信息工程尚未取得实质性的突破和进展。究其原因,一是研究还不全面深入,现有的成果还未囊括复句信息处理的所有环节和难题;二是大多数研究成果都是面向人的,很多方法在信息处理中操作性不强;三是各个研究相对孤立,未将所有环节串联起来,形成一个有机的整体。目前,复句的信息化研究主要是分句与非分句的识别、复句层次关系的识别,而这些研究都以关系词的提取为前提。可见,一方面,关系词的自动提取是其他各项研究工作得以开展的基础;另一方面,关系词作为构成复句的一个部件,本身也需要深入研究。在这种背景下,本文以面向中文信息处理为出发点,以邢福义先生的复句理论为指导,对复句关系词的自动标识方法进行研究和探讨,并以自动机理论、形式化逻辑等为辅助手段,对关系词标识涉及的问题进行建模,对总结的规则进行形式化描述和存储,并研究基于规则的关系词自动标识的方法,已达到自动标识复句关系词的目的。 本文的研究主要从以下四个方面展开: 1、全面总结影响关系词自动标识的因素。影响关系词标识准确率的因素主要有五类,分别为:关系副词的影响,介词的影响,关系标记不同用法的影响(同形异义词、同形异构词、同形异类词的关联和非关联用法的影响),关系标记搭配的影响和关系标记隐现形式的影响。对每一类影响因素,主要分析其各自的特点,并讨论对应的处理方法和策略。 2、对标记连用现象进行深入研究。主要研究二标记连用和三标记连用时各个标记的语法语义功能和类别。对于二标记连用,归纳出矛盾类和限制类两种类型。这种类型的区分,既可以在计算机处理时减少不必要的计算,也可以作为复句分析过程中的一个切入点。三标记连用现象中,识别不同的关系词所需的方法不同,没有一个统一且粒度较细的策略,需要具体问题具体分析。 3、研究句式特点与关系词标识之间的关系。主要考察三类句式:第一、格式固定且无歧义,但语义关系不好确定导致关系词辖域确定困难的句式,称之为特殊句式;第二、扩展句式,普通的基于搭配理论的算法不能很好地处理扩展句式的关系词标识问题;第三、多重复句的普通句式,复句实例的标记序列中含有多个标记对。对于特殊句式,采用表里关联的方式将标记序列与处理结果一一对应;对于扩展句式,采用自动机理论进行建模,既保证了可操作性,又保证了对语言现象的概括性;对普通句式,主要是把问题抽象化,并转化为数学模型,利用解空间的求解来对标记序列进行处理。针对上述句式,建立规则库,并探讨了基于规则的关系词自动标识方法。 4、对部分充盈模态和非充盈模态下关系词的标识问题进行研究。文章首先对分句的语义关联理论进行了进一步地补充,提出3大类14个语义关联特征,并制定了特征分析的优先图,修正了分句语义关联度的计算方法。充盈模态下的关系标记主要考察“不是……就是……”,“虽然……但是……所以……”等。研究发现,对“不是……就是……”,可利用极值分析法处理;对“虽然……但是……所以……”,暂无较好的处理策略,需要建立常识知识库。非充盈模态下主要是对三分句句式的关系词的识别进行考察,发现从关系标记的典型和非典型属性入手,通过结合搭配知识,并利用分句的语义关联特征,可较准确地标识出各个分句中的关系词。
【学位授予单位】:华中师范大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:H146

【引证文献】
中国期刊全文数据库 前1条
1 胡金柱;陈江曼;杨进才;舒江波;雷利利;;基于规则的连用关系标记的自动标识研究[J];计算机科学;2012年07期
中国硕士学位论文全文数据库 前4条
1 雷利利;复句关系词自动标识系统中规则解析器的研究[D];华中师范大学;2012年
2 陈江曼;复句关系词自动标识系统中规则库及其维护方法研究[D];华中师范大学;2012年
3 王中华;汉语复句关系词自动标识中规则自动生成方法研究[D];华中师范大学;2013年
4 徐涛;复句关系词自动标识中规则引擎的实现策略研究[D];华中师范大学;2013年
【参考文献】
中国期刊全文数据库 前10条
1 夏年喜;;逻辑学、语言学与信息科学——论自然语言逻辑的学科性质[J];安徽大学学报;2006年02期
2 周有斌;“不是A,就是B”句表述对象的数量及作用[J];安徽教育学院学报;2002年01期
3 李国庆;现代汉语的“不是P,也是Q”复句[J];安徽教育学院学报;2002年05期
4 周守晋;“主观量”的语义信息特征与“就”、“才”的语义[J];北京大学学报(哲学社会科学版);2004年03期
5 陆俭明;;要重视特征的研究与描写[J];长江学术;2006年01期
6 袁毓林;句子的焦点结构及其对语义解释的影响[J];当代语言学;2003年04期
7 王振来;关联词语的经络连接功能[J];大连民族学院学报;2002年02期
8 廖东红;关联理论与语义理解[J];达县师范高等专科学校学报;2005年03期
9 谭立重;关联理论与语义的确定[J];佛山科学技术学院学报(社会科学版);2005年05期
10 张平;;程度副词“还”新探[J];广西民族学院学报(哲学社会科学版);2006年03期
中国博士学位论文全文数据库 前6条
1 朱斌;现代汉语“是”字句然否类型联结研究[D];华中师范大学;2002年
2 曾常年;现代汉语因果句群研究[D];华中师范大学;2003年
3 姚双云;复句关系标记的搭配研究与相关解释[D];华中师范大学;2006年
4 罗进军;有标假设复句研究[D];华中师范大学;2007年
5 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年
6 尹蔚;多维视域下的有标选择复句研究[D];华中师范大学;2008年
中国硕士学位论文全文数据库 前3条
1 肖元珍;限选式“不是A,就是B”分析[D];暨南大学;2005年
2 钟莹;“不是A,就是B”格式及相关问题研究[D];暨南大学;2006年
3 韩栋;“哪怕”的多角度研究[D];河南大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 赵云涛;;现代汉语单复句划界问题探讨[J];阿坝师范高等专科学校学报;2009年02期
2 林秀艳;;藏汉语偏正短语语序之比较[J];阿坝师范高等专科学校学报;2010年01期
3 张德岁;;“V+Num+是+Num”构式初探[J];安徽大学学报(哲学社会科学版);2011年02期
4 周有斌;“不是A,就是B”句表述对象的数量及作用[J];安徽教育学院学报;2002年01期
5 汪红艳;开启之功 创新之力——略论汉语语法学的草创与革新[J];安徽教育学院学报;2002年05期
6 李国庆;现代汉语的“不是P,也是Q”复句[J];安徽教育学院学报;2002年05期
7 刘开骅;;选择问句疑问语气词脱落的历时轨迹与内在动因[J];合肥师范学院学报;2008年05期
8 樊友新;;从“被就业”看“被”的语用功能[J];合肥师范学院学报;2010年02期
9 袁卫华;;《五灯会元》中带语气副词的测度问句[J];合肥师范学院学报;2012年02期
10 陈勇;名词谓语句研究综述[J];安徽广播电视大学学报;2005年02期
中国重要会议论文全文数据库 前10条
1 通拉嘎;赵小兵;;论蒙古语词素切分的实现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 斯·劳格劳;华沙宝;萨如拉;;基于统计方法的蒙古语依存句法分析模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 周明海;亢世勇;;语义角色句法实现的词汇语义制约信息库的建设及其应用[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 曾青青;杨尔弘;;事件词驱动的文本事件信息结构初探[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 沈家煊;;“名动词”的反思:问题和对策[A];高名凯先生学术思想研讨会——纪念高名凯先生诞辰100周年论文集[C];2011年
6 郭锐;;语义等值和汉语虚词的意义分析[A];和谐社会:社会公正与风险管理——2005学术前沿论坛论文集(下卷)[C];2005年
7 ;Ma Shi Wen Tong and its Theory of Language[A];语言与文化研究(第一辑)[C];2007年
8 陈昌来;;特殊动词的句法语义属性研究与对外汉语教学[A];对外汉语教学的全方位探索——对外汉语研究学术讨论会论文集[C];2004年
9 周健;;试论汉语教学的语感培养[A];对外汉语教学的全方位探索——对外汉语研究学术讨论会论文集[C];2004年
10 周红红;;外来词的界定[A];中国辞书学会双语词典专业委员会第七届年会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 邱闯仙;现代汉语插入语研究[D];南开大学;2010年
2 陈佳;论英汉运动事件表达中“路径”单位的“空间界态”概念语义及其句法—语义接口功能[D];上海外国语大学;2010年
3 胡文辉;语言评价理论的价值哲学研究[D];上海外国语大学;2010年
4 吴善子;汉韩反诘语气副词对比研究[D];上海外国语大学;2010年
5 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
6 卢建平;基于拓扑学和统计学的无字库汉字智能造字研究[D];华南理工大学;2010年
7 李云靖;北京话音节发音的时间结构[D];南开大学;2010年
8 曹芳宇;唐五代量词研究[D];南开大学;2010年
9 李秉震;汉语话题标记的语义、语用功能研究[D];南开大学;2010年
10 郭红;基于第二语言教学的汉语语气范畴若干问题研究[D];南开大学;2010年
中国硕士学位论文全文数据库 前10条
1 吴艺彬;俄语三价动词的语义配价与句法模式[D];哈尔滨师范大学;2010年
2 赵桂阳;现代汉语“不是X的X”结构考察[D];哈尔滨师范大学;2010年
3 顾倩;现代汉语否定副词“不”“没(没有)”“别”的对比研究[D];辽宁师范大学;2010年
4 张军珲;基于统计的常用汉语副词用法自动识别研究[D];郑州大学;2010年
5 石娜;从形合意合角度比较《傲慢与偏见》两译本[D];上海外国语大学;2010年
6 韦宁杰;插入语的主观性探析[D];上海外国语大学;2010年
7 丁熠;“契合”类语气副词研究[D];上海外国语大学;2010年
8 刘阳;基于框架语义学的语篇连贯研究[D];哈尔滨工程大学;2010年
9 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
10 井志强;基于扩展的VSM中文文本分类方法[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 梁南元;书面汉语的自动分词与一个自动分词系统—CDWS[J];北京航空学院学报;1984年04期
2 杨放春;陈俊亮;;SDL 的一阶谓词表示法及其应用[J];北京邮电学院学报;1989年03期
3 孙运传,别荣芳;产生式规则库的求精研究[J];北京师范大学学报(自然科学版);2003年04期
4 赵晓琴;孙毅中;薛晓蕾;;基于知识单元的自然语言结构化解析模型——以城市规划领域规则为例[J];测绘科学;2010年06期
5 罗永龙 ,黄刘生 ,荆巍巍 ,姚亦飞 ,陈国良;一个保护私有信息的布尔关联规则挖掘算法[J];电子学报;2005年05期
6 许一震,王永成,吴芳芳;一种基于反向有限自动机的匹配算法[J];高技术通讯;2001年02期
7 郭茂祖,孙华梅,黄梯云;专家系统中知识库组织与维护技术的研究[J];高技术通讯;2002年02期
8 庞伟正,金瑞琪,王成武;一种规则引擎的实现方法[J];哈尔滨工程大学学报;2005年03期
9 刘书家,孙名松;知识库维护技术的研究[J];哈尔滨理工大学学报;1997年01期
10 吴锋文;;基于关系标记的汉语复句分类研究[J];汉语学报;2011年03期
中国博士学位论文全文数据库 前5条
1 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
2 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
3 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年
4 姚双云;复句关系标记的搭配研究与相关解释[D];华中师范大学;2006年
5 贾彩燕;关联规则挖掘的取样复杂性分析[D];中国科学院研究生院(计算技术研究所);2004年
中国硕士学位论文全文数据库 前10条
1 许婷;面向中文信息处理的复句特征分析器的研究与实现[D];华中师范大学;2011年
2 王大萌;入侵检测系统中模式匹配算法的研究[D];哈尔滨工程大学;2006年
3 周利江;结构化CGM图形文件的解析与转换方法研究[D];中国海洋大学;2006年
4 刘金龙;drools规则引擎模式匹配效率优化研究及实现[D];西南交通大学;2007年
5 孙晓飞;基于规则引擎的测试用例提取与维护方法研究[D];成都理工大学;2008年
6 方应飞;基于规则引擎的自定义查询系统的设计与实现[D];北京邮电大学;2008年
7 张宜凯;基于智能Agent的分布式入侵检测系统设计[D];西安科技大学;2008年
8 殷超;网络入侵检测中模式匹配算法的研究[D];山东大学;2008年
9 王晓光;规则引擎在分布式条件下的应用研究[D];重庆大学;2008年
10 汪峰;基于规则软件开发的研究及其在医疗保险系统中的应用[D];天津大学;2009年
【二级引证文献】
中国硕士学位论文全文数据库 前3条
1 陈江曼;复句关系词自动标识系统中规则库及其维护方法研究[D];华中师范大学;2012年
2 王中华;汉语复句关系词自动标识中规则自动生成方法研究[D];华中师范大学;2013年
3 徐涛;复句关系词自动标识中规则引擎的实现策略研究[D];华中师范大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 周洪波;表判断“是”字句的语义类型[J];安徽教育学院学报(社会科学版);1992年04期
2 周有斌;“不是A,就是B”句表述对象的数量及作用[J];安徽教育学院学报;2002年01期
3 李国庆;现代汉语的“不是P,也是Q”复句[J];安徽教育学院学报;2002年05期
4 邢公畹;语词搭配问题是不是语法问题?[J];安徽师大学报(哲学社会科学版);1978年04期
5 黎泽渝;;从句群说到语法的综合性教学[J];安徽师大学报(哲学社会科学版);1988年01期
6 赵琦;一个容易划错的多重复句——兼与王端商榷[J];安徽教育;1989年05期
7 周谨驯;关于几个多重复句的结构层次[J];鞍山师范学院学报;1984年01期
8 李伟;试论三种不同结构格局的句子——多重复句研究之一[J];鞍山师范学院学报;1988年01期
9 李伟;二重复句结构格式初探——多重复句研究之二[J];鞍山师范学院学报;1988年02期
10 徐通锵;叶蜚声;;译音对勘与汉语的音韵研究——“五四”时期汉语音韵研究方法的转折[J];北京大学学报(哲学社会科学版);1980年03期
中国重要会议论文全文数据库 前3条
1 刘智颖;;论广义对象语义块的分离[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 吕雅娟;赵铁军;李生;杨沐昀;;统计和词典方法相结合的双语语料库词对齐[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 杨沐昀;赵铁军;于浩;;自底向上的汉语句法标注体系设计与实践[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前3条
1 宋文辉;现代汉语动结式配价的认知研究[D];中国社会科学院研究生院;2003年
2 雒自清;语义块类型、构成及变换的分析与处理[D];中国科学院研究生院(声学研究所);2004年
3 罗进军;有标假设复句研究[D];华中师范大学;2007年
中国硕士学位论文全文数据库 前4条
1 唐兴全;现代汉语复杂句蜕块研究[D];北京语言文化大学;2002年
2 王琳;基于本体的汉语复句语义分析[D];华中师范大学;2006年
3 罗旋;基于复句领域本体的语义标注方法研究[D];华中师范大学;2006年
4 凌瑜;让步连词演变及语法功能研究例说[D];浙江大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 黄积达;浅谈复合定语从句[J];广西大学梧州分校学报;1997年01期
2 张旭英 ;李云林;;如何填定语从句关系词[J];英语知识;1995年12期
3 严修鸿;客家方言与周边方言的关系词[J];汕头大学学报(人文社会科学版);2001年04期
4 朱胜荣;;定语从句关系词用法辨析[J];初中生辅导;2007年Z6期
5 赵修江;;疑问词、连接词、关系词专练[J];中学英语园地(初三版);2008年Z1期
6 陈保亚;从核心词分布看汉语和侗台语的语源关系[J];民族语文;1995年05期
7 王常伟;;定语从句关系词选用的四个确定[J];初中生辅导;2007年Z3期
8 陈建文;刘月凤;;走出定语从句教学误区[J];科技咨询导报;2007年10期
9 沈正平;;定语从句中关系词的用法详解[J];科技信息(学术研究);2008年27期
10 谷明娟;;词块的运用与英语写作能力的关系[J];文教资料;2009年19期
中国重要会议论文全文数据库 前10条
1 孙培福;;逻辑现代化:从天然渐变为人造[A];第一届全国非形式逻辑与法律逻辑学术研讨会论文集[C];2004年
2 陈齐林;;汉语系词“是”的研究综合论述[A];江西省语言学会2005年年会论文集[C];2005年
3 李菊红;;高中英语语法教学应讲究系统性[A];国家教师科研基金“十一五”成果集(中国名校卷)(五)[C];2009年
4 江轶;;现代汉语定语从句的认知语言学和类型学考察[A];第四届全国认知语言学研讨会论文摘要汇编[C];2006年
5 李家治;;记忆、思维和语言—机器理解汉语中的问题[A];中国心理学会第三次会员代表大会及建会60周年学术会议(全国第四届心理学学术会议)文摘选集(下)[C];1981年
6 李菊红;;高中英语语法教学应讲究系统性[A];国家教师科研基金十一五阶段性成果集(江苏卷)[C];2010年
7 张忠义;;试谈中国名辩学的命题逻辑模式[A];“中国名辩学与方法论研讨会、道家与西方研讨会、冯友兰哲学思想研讨会”优秀论文精选[C];1998年
8 王晋华;张慧琴;;英汉语言中的连词及其翻译[A];中国英汉语比较研究会第七次全国学术研讨会论文集[C];2006年
9 刘禀诚;;新闻标题的分句隐含[A];江西省语言学会2008年年会论文集[C];2008年
10 张忠义;;关于“决策”定义的质疑[A];逻辑今探——中国逻辑学会第五次代表大会暨学术讨论会论文集[C];1996年
中国重要报纸全文数据库 前10条
1 马清华;义近:亲属关系词必须满足的意义条件[N];中国社会科学报;2010年
2 蒋雄达;让小提琴歌唱起来[N];音乐周报;2003年
3 王一民;不宜滥用“然后”“的话”[N];语言文字周报;2010年
4 甘霖 编辑整理;为考出理想成绩支招[N];大众科技报;2002年
5 王洪达 章小琴;教学生这样阅读[N];中国教师报;2003年
6 汪国胜 刘中兴;邢福义:“拱”出来的路[N];光明日报;2003年
7 记者 纪海珠;怎么教孩子说话[N];信息时报;2003年
8 北京大学附属中学 范存智;高考英语写作:去掉“毛病”拿高分[N];中国教育报;2004年
9 曹保顺;2004年高考语文虚词解析[N];中国教育报;2004年
10 乐俊淮;句分逗顿有学问[N];新闻出版报;2000年
中国博士学位论文全文数据库 前10条
1 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
2 杨红;现代汉语关系名词研究[D];华中师范大学;2013年
3 范丽君;汉藏语因果类复句研究[D];中央民族大学;2011年
4 吴黄青娥;汉越复句关联标记模式比较[D];华中师范大学;2012年
5 于素红;聋生解决加减文字题的认知研究[D];华东师范大学;2007年
6 陆招英;闽方言群音系与侗台语关系词比较研究[D];福建师范大学;2006年
7 陈孝玲;侗台语核心词研究[D];华中科技大学;2009年
8 万光荣;现代汉语二合复句中分句语气异类组配研究[D];华中师范大学;2012年
9 刘晓江;基于统计滚雪球模型的知识挖掘理论与方法[D];中国科学技术大学;2011年
10 张玲;象似语序与突显语序互动研究[D];华东师范大学;2010年
中国硕士学位论文全文数据库 前10条
1 容艺梅;初中生汉语母语书面表达中复句关系标记偏误考察及教学对策[D];华中师范大学;2011年
2 任丽慧;汉语复句关系分类及“三分法”系统在对外汉语教学中的应用研究[D];陕西师范大学;2012年
3 颜琪艳;《林兰香》有标复句研究[D];中南大学;2012年
4 雷利利;复句关系词自动标识系统中规则解析器的研究[D];华中师范大学;2012年
5 陈江曼;复句关系词自动标识系统中规则库及其维护方法研究[D];华中师范大学;2012年
6 唐莹;留学生主语隐现问题考察[D];华东师范大学;2011年
7 纪春萍;汉译俄过程中单(?)复句转换研究[D];黑龙江大学;2011年
8 王展楣;关系词“是”和“be”的伪歧义分析及判别[D];大连理工大学;2005年
9 龙文全;苗汉语关系词研究[D];广西民族大学;2008年
10 沈威;基于渡越矩阵与语境计算模型的复句关系词的自动标注[D];华中师范大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026