期刊库|学位论文库|会议论文库|飞度BOOK|站内搜索注册|充值中心|购买知网卡|送卡上门|帮助中心|
全文文献: “飞度BOOK”首届期刊庙会开幕啦!
做个飞度客,万千杂志,想看就看!
《沈阳航空工业学院》 2006年
加入收藏 获取最新

面向汉语单句的依存句法分析研究

周俏丽  
【摘要】:句法分析是衔接自然语言理解中词法分析与语义分析的桥梁,在自然语言理解中具有至关重要的作用。在自然语言分析中,传统的基于规则的方法和近年来兴起的基于统计的方法各有利弊,如何把二者有机的结合起来,以提高分析器的处理能力,是当前计算语言学的重要课题。同时,句法结构歧义现象也成为了制约句法分析的巨大障碍。 针对上述问题,本文对国内外句法分析和结构歧义消解展开了较为全面的调研。提出了一种规则与统计相结合的汉语依存句法分析模型。该模型的主要特点是把句法分析分为不同的阶段,第一个阶段是组块分析;第二个阶段是组块内依存关系分析;第三个阶段是组块间依存关系分析。并针对每个阶段所要解决问题的不同特点运用相应的规则和统计方法进行处理。为了实现上述分析策略,本文在以下几个方面展开了研究: 1、词间长距离依存现象分析。在任何语言中,词语间的长距离依存现象都是普遍存在的。我们通过对汉语单句的句法和语义的分析,发现长距离依存词对,在此基础上制定了用于识别长距离依存关系的依存模板。 2、句法结构歧义消解。提出了以下的句法结构歧义消解策略。 1)针对全体句法结构歧义的一般消解策略。在本文的句法分析中,每个阶段问题的处理都会遇到句法结构歧义问题。在已有规则不能消解的情况下,作为一种通用消解策略,我们提出运用改进的T检验方法来计算词语之间的搭配信息,并以此来实现句法结构歧义的消解。 2)针对特定句法结构歧义的特定消解策略。为了更好的解决句法结构歧义问题,本文针对汉语句法结构歧义中最常的“动+名1+的+名2”歧义结构,进行了深入的研究和探讨,提出了基于知网和基于最大熵的歧义消解方法。综上所述,本文将句法分析分解为几个不同阶段进行研究,针对不同阶段的问题分别使用相应的规则与统计的方法,即减少了规则冲突,又加强了统计分析的针对性,从而有效地提高了句法分析的正确率。句法分析的关键问题是歧义结构的处理,我们针对不同歧义结构,采用了通用消解策略和特定消解策略相结合 的方法,并取得了较好的实验结果。对于典型的“动+名1+的+名2”歧义结构,基于知网和基于最大熵的歧义消解方法都达到了80%以上的正确率。
【关键词】:句法分析 句法结构歧义 歧义消解 长距离依存 组块分析
【学位授予单位】:沈阳航空工业学院
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP391.1
【DOI】:CNKI:CDMD:2.2007.067391
【目录】:
  • 摘要5-7
  • Abstract7-13
  • 第一章 绪论13-19
  • 1.1 句法分析和句法分析树13-14
  • 1.2 课题的提出和意义14-17
  • 1.2.1 面向单句15
  • 1.2.2 依存文法15-16
  • 1.2.3 采用规则与统计相结合的方法16-17
  • 1.3 本文的工作17-18
  • 1.4 论文的组织18-19
  • 第二章 研究方法综述19-29
  • 2.1 句法分析技术回顾19-23
  • 2.1.1 基于规则的句法分析19-21
  • 2.1.2 基于语料库的句法分析21-23
  • 2.1.3 规则与统计相结合的句法分析23
  • 2.2 句法结构歧义消解23-27
  • 2.2.1 基于规则的方式消除歧义24-25
  • 2.2.2 基于概率上下文无关文法的句法分析歧义消解25-26
  • 2.2.3 统计与规则相结合的歧义消解26
  • 2.2.4 基于实例的汉语句法结构分析歧义消解26-27
  • 2.3 长距离依存分析27-28
  • 2.4 本章小结28-29
  • 第三章 单句内长距离依存现象分析29-36
  • 3.1 依存语法简介29-30
  • 3.2 词汇语义间的长距离依存分析30-31
  • 3.2.1 固定搭配词对之间的依存关系30-31
  • 3.2.2 指示代词短语与数量词短语31
  • 3.3 句子成分间的长距离依存关系分析31-35
  • 3.2.1 介词与谓词的依存关系32-34
  • 3.2.2 其它动词与谓词的依存关系34
  • 3.2.3 谓词之间的依存关系34-35
  • 3.4 本章小结35-36
  • 第四章 面向依存句法分析的谓词识别36-45
  • 4.1 谓语中心词识别的整体结构36-37
  • 4.2 利用依存模板排除不能成为谓词的词37-38
  • 4.3 基于规则进行谓词识别38-39
  • 4.3.1 判断句的处理39
  • 4.4 基于统计进行谓词识别39-43
  • 4.4.1 计算词对间的相关强度系数41-43
  • 4.4.2 利用相关强度系数进行谓词识别的过程43
  • 4.5 全句中心语的选择43
  • 4.6 实验结果和分析43-44
  • 4.7 本章小结44-45
  • 第五章 句子依存关系的生成45-54
  • 5.1 组块分析45-48
  • 5.1.1 指定组块识别46-47
  • 5.1.2 组块核心词的确定47
  • 5.1.3 指定组块识别实验结果及分析47-48
  • 5.2 复杂组块内部依存关系分析48-49
  • 5.3 组块核心词间依存关系分析49-53
  • 5.3.1 基于规则组块间依存关系的分析49-50
  • 5.3.2 基本组块间依存关系分析过程50
  • 5.3.3 基本组块与复杂组块间分析过程50-52
  • 5.3.4 基于统计组块间依存关系的分析52-53
  • 5.4 实验结果53
  • 5.5 本章小结53-54
  • 第六章 基于知网的 VNN结构歧义消解54-63
  • 6.1 VNN歧义结构分析54-55
  • 6.2 知网简介55
  • 6.3 基于知网的语义相似度消歧55-58
  • 6.3.1 语义相似度的计算55-57
  • 6.3.2 排歧算法的实例说明57-58
  • 6.4 基于知网义原分类树的规则消歧58-61
  • 6.5 实验结果和分析61-62
  • 6.5.1 实验流程61
  • 6.5.2 实验结果61
  • 6.5.3 结果分析61-62
  • 6.6 本章小结62-63
  • 第七章 基于最大熵的 VNN结构歧义消解63-71
  • 7.1 句法结构消歧中的最大熵模型63-66
  • 7.1.1 句法结构消歧中的最大熵模型的建立63-66
  • 7.2 句法歧义结构分析66-69
  • 7.2.1 句法歧义结构的外部环境分析66-67
  • 7.2.2 句法结构消歧中特征的提取67-69
  • 7.3 实验结果及分析69-70
  • 7.3.1 特征组合对实验的影响69
  • 7.3.2 训练语料规模对实验的影响69-70
  • 7.4 本章小结70-71
  • 结论71-73
  • 附录I 汉语词性标注集73-75
  • 附录II 依存关系规范75-81
  • 附录III 依存模板81-82
  • 参考文献82-85
  • 攻读硕士期间发表 (含录用)的学术论文85-86
  • 致谢86-87
全文下载: CAJ格式
不支持迅雷等加速下载工具,请取消加速工具后下载
CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式

【参考文献】
中国期刊全文数据库 前10条
1 穗志方,俞士汶;汉语单句谓语中心词识别知识的获取及应用[J];北京大学学报(自然科学版);1998年Z1期
2 周明,黄昌宁,张敏,白栓虎,吴升;统计与规则并举的汉语句法分析模型[J];计算机研究与发展;1994年02期
3 陈宣,孔骏,陈玉泉,陆汝占;基于概率上下文无关文法的句法分析歧义消解新模式[J];计算机工程;2002年02期
4 蔡义发;自然语言理解的研究与发展[J];计算机应用与软件;1992年03期
5 杨晓峰,李堂秋,洪青阳;基于实例的汉语句法结构分析歧义消解[J];中文信息学报;2001年03期
6 龚小谨,罗振声,骆卫华;汉语句子谓语中心词的自动识别[J];中文信息学报;2003年02期
7 李国臣,孟静;利用主语和谓语的句法关系识别谓语中心词[J];中文信息学报;2005年01期
8 罗振声,郑碧霞;汉语句型自动分析和分布统计算法与策略的研究[J];中文信息学报;1994年02期
9 周明,黄昌宁;面向语料库标注的汉语依存体系的探讨[J];中文信息学报;1994年03期
10 周强;规则和统计相结合的汉语词类标注方法[J];中文信息学报;1995年03期
中国重要会议论文全文数据库 前1条
1 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国硕士学位论文全文数据库 前1条
1 皮晓峰;基于概率上下文无关语法的句法分析研究与实现[D];电子科技大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 张大强;;转换生成语法与汉语歧义句的分析[J];安徽文学(下半月);2009年03期
2 谭咏梅;王小捷;周延泉;钟义信;;使用SVMs进行汉语浅层分析[J];北京邮电大学学报;2008年01期
3 韩玉花;;现代汉语中的“花园小径”现象[J];成都大学学报(教育科学版);2007年02期
4 李琼;;书逗前后语言片段的非分句识别[J];重庆工学院学报(社会科学版);2008年01期
5 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
6 孙宏林,俞士汶;浅层句法分析方法概述[J];当代语言学;2000年02期
7 冯志伟;花园幽径句的自动分析算法[J];当代语言学;2003年04期
8 王跃龙;姬东鸿;;汉语树库综述[J];当代语言学;2009年01期
9 谌志群,周昌乐;汉语机器理解研究现状及展望[J];电脑学习;1999年02期
10 刘向华;对隐马尔科夫模型中动态编程的探讨[J];电脑学习;2005年06期
中国重要会议论文全文数据库 前10条
1 王治敏;俞士汶;;人称代词和名词的歧义消解研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 徐德宽;;现代汉语双宾构造中两个宾语的题元角色[A];第六届汉语词汇语义学研讨会论文集[C];2005年
3 王红军;徐林;张继宏;;一种模糊综合决策汉语谓词识别算法[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
4 魏志成;;汉语句型系统的解构与重构[A];中国英汉语比较研究会第七次全国学术研讨会论文集[C];2006年
5 毛家菊;张琳;夏爱军;陆汝占;;情景中汉语指示代词短语解释的形式化[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 周强;詹卫东;任海波;;构建大规模的汉语语块库[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
7 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
8 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 侯敏;;汉语自动分析中的若干问题与对策[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
10 郑旭玲;李堂秋;杨晓峰;陈毅东;;基于语义规则的汉语短语结构分析排歧初探[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 吕艳辉;基于语料库的现代汉语手部动词研究[D];山东大学;2008年
2 戴祖旭;文本载体信息隐藏研究[D];华中科技大学;2007年
3 骆琳;面向计算机的现代汉语“得”字研究[D];华中科技大学;2007年
4 杨芸;汉语隐喻识别与解释计算模型研究[D];厦门大学;2008年
5 张炯;汉语量化结构的形式分析[D];浙江大学;2009年
6 蒋本蓉;“意思—文本”模式的词库理论与词库建设[D];黑龙江大学;2008年
7 丘宏俊;基于知识的飞机装配工艺设计关键技术研究[D];西北工业大学;2006年
8 彭艳;短语结构语法与依存语法的心理现实性研究[D];上海外国语大学;2007年
9 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
10 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年
中国硕士学位论文全文数据库 前10条
1 邓攀;开放式文档同构引擎关键技术研究与实现[D];上海交通大学;2009年
2 来火尧;基于主题相关性的中文文本情感分类研究[D];上海交通大学;2009年
3 高玲玲;基于依存语法的汉语句法分析研究[D];中国海洋大学;2009年
4 韦卓;自然语言理解中篇章的名词聚类在测试计量中的应用[D];西安电子科技大学;2008年
5 罗瑶;面向篇章的代词指代消解及其在机械产品设计中的应用[D];西安电子科技大学;2008年
6 常建鹏;面向篇章的介词语义分析及其在产品设计中的应用[D];西安电子科技大学;2008年
7 周洪艳;“给X+V”格式中介词短语“给X”的边界识别[D];上海师范大学;2008年
8 杨煜舒;面向信息处理的介词“向”及其结构研究[D];上海师范大学;2008年
9 程月;现代汉语动宾搭配多角度考察及其自动识别[D];南京师范大学;2008年
10 王东波;有标记联合结构的自动识别[D];南京师范大学;2008年
【二级参考文献】
中国期刊全文数据库 前10条
1 穗志方,俞士汶;汉语单句谓语中心词识别知识的获取及应用[J];北京大学学报(自然科学版);1998年Z1期
2 冯志伟;;特思尼耶尔的从属关系语法[J];国外语言学;1983年01期
3 周明,黄昌宁,张敏,白栓虎,吴升;统计与规则并举的汉语句法分析模型[J];计算机研究与发展;1994年02期
4 张虎,郑家恒,刘江;汉语语料库词性标注自动校对方法研究[J];计算机应用;2005年01期
5 冯志伟;中文科技术语的结构描述及潜在歧义[J];中文信息学报;1989年02期
6 孙茂松,黄昌宁;汉语中的兼类词、同形词类组及其处理策略[J];中文信息学报;1989年04期
7 张普;信息处理用现代汉语语义分析的理论与方法[J];中文信息学报;1991年03期
8 黄昌宁,苑春法,潘诗梅;语料库、知识获取和句法分析[J];中文信息学报;1992年03期
9 龚小谨,罗振声,骆卫华;汉语句子谓语中心词的自动识别[J];中文信息学报;2003年02期
10 罗振声,郑碧霞;汉语句型自动分析和分布统计算法与策略的研究[J];中文信息学报;1994年02期
【相似文献】
中国期刊全文数据库 前10条
1 舒鑫柱,杨尔弘;基于HOWNET的汉语组块分析[J];河南职技师院学报;2001年04期
2 张琳琳,宋继平,王能忠;基于核心推导的句法分析[J];西南师范大学学报(自然科学版);1997年03期
3 余正涛,樊孝忠;基于最大熵模型的汉语问句语义组块分析[J];计算机工程;2005年17期
4 徐艳华;陈小荷;;面向自动句法分析的“V+V”结构歧义研究[J];计算机工程与应用;2006年33期
5 刘芳,赵铁军,于浩,杨沐昀,方高林;基于统计的汉语组块分析[J];中文信息学报;2000年06期
6 杨宪泽;自然语言处理的句法分析和规则索引[J];科技通报;2002年06期
7 刘伟权,王明会,钟义信;建立现代汉语依存关系的层次体系[J];中文信息学报;1996年02期
8 杨思春,陈家骏;汉语自动句法分析中结构歧义分析与研究[J];昆明理工大学学报(理工版);2005年02期
9 孟遥,赵铁军,李生;面向机器翻译系统句法分析器的研究与实现[J];黑龙江工程学院学报;2002年03期
10 张敏,罗振声;语料库与知识获取模型[J];中文信息学报;1994年01期
中国重要会议论文全文数据库 前10条
1 李素建;刘群;;基于混合模型的组块分析技术[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
2 徐艳华;陈小荷;李斌;陈钟;;面向自动句法分析的现代汉语“V+V”结构歧义研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 赵铁军;李生;孟遥;黄玉;杨沐昀;;机器翻译系统中句法分析技术的研究实践[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 张惠春;由丽萍;谷波;刘开瑛;;面向框架语义分析的汉语句法分析模型[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 张浩;刘群;白硕;;结构上下文相关的概率句法分析[A];第一届学生计算语言学研讨会论文集[C];2002年
6 王治敏;俞士汶;;人称代词和名词的歧义消解研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
7 曹海龙;孟遥;李生;赵铁军;;一个改进的头驱动英语句法分析模型[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
8 郭慧志;谢学敏;张普;;抽象名词和组织类名词的限定作用[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 张亚旭;刘友谊;舒华;孙茂松;;汉语名动兼类词的句法分析:来自人类阅读实验的证据[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
10 冯娟娟;李晗静;李生;;基于句法分析的中文语义角色标注实现[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国重要报纸全文数据库 前10条
1 本报记者 黄彩燕 实习记者 苏静雯;中日经济依存关系显著[N];亚太经济时报;2007年
2 江瑞平;中日经济依存关系“易位”[N];人民日报;2004年
3 本报记者 张霞;马振骋:生活无“译本”[N];21世纪经济报道;2007年
4 ;换个角度看问题 中国人比美国人更擅长[N];中国社会报;2007年
5 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
6 金科;中德两国学者共同研讨市场经济[N];中国社会科学院院报;2007年
7 李琨;IBM百度共拓企业搜索[N];中国计算机报;2006年
8 ;苏霍姆林斯基的著作影响了中国几代教育者[N];中国教育报;2006年
9 屈永华;对QoS和SLM有误解[N];中国计算机报;2002年
10 记者 潘竑;企业搜索:激活被遗忘的信息财富[N];金融时报;2006年
中国博士学位论文全文数据库 前10条
1 徐艳华;现代汉语实词语法功能考察及词类体系重构[D];南京师范大学;2006年
2 唐秀玲;论话题及其在汉语语法分析中的应用[D];上海师范大学;1997年
3 洪淼;现代汉语连动结构研究[D];南京师范大学;2004年
4 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
5 申敬善;现代汉语“在”字句研究[D];复旦大学;2006年
6 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
7 王旭川;中国小说续书的历史发展[D];上海师范大学;2004年
8 姚剑波;基于句法分析的安全信息流[D];贵州大学;2006年
9 刘启和;基于Rough集的知识发现及其在汉语处理中的应用[D];电子科技大学;2005年
10 李素建;汉语组块计算的若干研究[D];中国科学院研究生院(计算技术研究所);2002年
中国硕士学位论文全文数据库 前10条
1 周俏丽;面向汉语单句的依存句法分析研究[D];沈阳航空工业学院;2006年
2 李曙光;POSS-ING结构的句法分析[D];南京师范大学;2002年
3 王朔;基于Chart算法的句法分析系统的设计与实现[D];湖南大学;2005年
4 金泉;日语长句子的句法分析[D];大连理工大学;2004年
5 尹鹏;基于SVM的中文组块间依存关系分析[D];大连理工大学;2006年
6 张瑞霞;基于语义的汉语句法分析系统的研究与实现[D];西北大学;2005年
7 干诚;句子理解中的连接歧义消解及其对教学的启示[D];上海师范大学;2004年
8 耿春霞;基于机械设计领域的汉语句法分析研究[D];西安电子科技大学;2004年
9 尹钟宏;“有”字句[D];湖南师范大学;2002年
10 姚益龙;“VP+NP_1+的+NP_2”结构歧义的研究[D];首都师范大学;2007年
关于知网|版权声明|学术会议服务|广告服务|在线咨询
京ICP证040431号互联网出版许可证新出网证(京)字008号北京市公安局海淀分局备案号:110 1081725
订购咨询热线:800-810-6613、010-62985026免费送卡上门
主办:清华大学
数字出版:中国学术期刊电子杂志社
在线发行:同方知网(北京)技术有限公司
关 闭
关 闭
关 闭