收藏本站
《大连理工大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于SVM的中文组块间依存关系分析

尹鹏  
【摘要】:句法分析是机器翻译的核心部分,而依存关系分析又是一种重要的句法分析方法,依存关系分析所成生的依存关系树即可以表示词与词之间的深层联系又可以节省存储空间。本文研究了使用支持向量机(SVM)进行中文依存关系识别的方法。 因为组块分析可以判断出确定性高的部分结果,减少句法分析中的歧义,所以本文在组块基础上进行依存关系分析,为了使句子中的每个词都属于且仅属于一个组块,所以扩展了自然语言处理实验室原有的六种组块类型,使组块类型扩展到十二种。 在依据依存公理的基础上,制定了一套中文组块间依存关系体系,共定义了二十四种组块间的依存关系类型,为依存关系语料库的制作提供了标准。 本文分别使用了确定性分析算法和非确定性分析算法配合SVM分类器进行中文组块的依存关系识别,因为Nivre算法已经成功的应用于英文的依存关系分析,又因为英文和中文在句法特点上具有一定的相似性,所以本文采用Nivre算法作为中文组块依存分析的确定性算法。根据中文组块的特点本文设计了非确定性算法,其基本思想为,对句子中任意的两个组块,使用SVM分类器判断它们之间的依存关系,并得到他们之间的依存系数,即两组块之间的依存关系的强弱,然后为每个组块选取依存系数最大的节点作为支配节点,最后消除交叉依存和循环依存,输入一颗完整的依存关系树。 由实验得出,使用确定性算法的正确率为75.664%,使用非确定性算法的正确率为82.574%,可以看出对于中文组块依存关系分析来说,非确定性算法的性能要好于确定性算法,本文最后还分析了导致错误分析的部分原因和主要的错误类型。
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP391.1

【相似文献】
中国期刊全文数据库 前10条
1 陈发鸿;;基于核方法的文本极性分类研究[J];海峡科学;2011年08期
2 许德山;张智雄;赵妍;;中文问句与RDF三元组映射方法研究[J];图书情报工作;2011年06期
3 李军辉;周国栋;朱巧明;钱培德;;中文名词性谓词语义角色标注[J];软件学报;2011年08期
4 宿建军;张小燕;吐尔洪·吾司曼;李晓;;联合式多引擎维汉机器翻译系统[J];计算机工程;2011年16期
5 朱聪慧;赵铁军;韩习武;郑德权;;基于加权子序列核函数的次范畴论元分析[J];高技术通讯;2010年02期
6 刘凯;乌日力嘎;斯钦图;姜文斌;刘群;;基于双语约束的蒙古语无监督依存分析[J];中文信息学报;2011年04期
7 黄亿华;濮小佳;袁春风;武港山;;基于句法树结构的情感评价单元抽取算法[J];计算机应用研究;2011年09期
8 何晓阳;吴治蓉;;美国信息素养评价标准的比较研究[J];中华医学图书情报杂志;2011年04期
9 杨皓东;江凌;李国俊;;国内自然语言处理研究热点分析——基于共词分析[J];图书情报工作;2011年10期
10 李纲;王忠义;;人际情报网络与知识本体网络之间关系研究[J];情报杂志;2011年06期
中国重要会议论文全文数据库 前10条
1 斯·劳格劳;华沙宝;萨如拉;;基于统计方法的蒙古语依存句法分析模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 丁凡;王斌;白硕;刘宜轩;李亚楠;;文本检索中句法信息的有效利用研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 辛霄;范士喜;王轩;王晓龙;;基于最大熵的依存句法分析[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 汪红林;丁金涛;王红玲;周国栋;;基于依存关系的语义角色标注[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 张惠春;由丽萍;谷波;刘开瑛;;面向框架语义分析的汉语句法分析模型[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 陈鑫;车万翔;刘挺;;基于主动学习的中文依存句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 陈劲光;何婷婷;李芳;桂卓民;;基于概率和句法分析的中文句子修剪[A];第五届全国青年计算语言学研讨会论文集[C];2010年
8 王丹;姬东鸿;黄玮;;一种基于MIRA和遗传算法的句法分析模型构造方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 才藏太;;基于规则的汉藏机器翻译系统中二分法的句法分析方法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
10 曹海龙;孟遥;李生;赵铁军;;一个改进的头驱动英语句法分析模型[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
中国重要报纸全文数据库 前10条
1 江瑞平;中日经济依存关系“易位”[N];人民日报;2004年
2 本报记者 黄彩燕 实习记者 苏静雯;中日经济依存关系显著[N];亚太经济时报;2007年
3 路向军(作者单位:天津市委党校);高技术产业对传统产业的依存关系[N];科技日报;2000年
4 本报记者 张霞;马振骋:生活无“译本”[N];21世纪经济报道;2007年
5 ;换个角度看问题 中国人比美国人更擅长[N];中国社会报;2007年
6 金科;中德两国学者共同研讨市场经济[N];中国社会科学院院报;2007年
7 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
8 ;苏霍姆林斯基的著作影响了中国几代教育者[N];中国教育报;2006年
9 侯欣一;法治与和谐社会的构建[N];光明日报;2006年
10 张雨竹记者 胡晓波;全市今年草原工作目标确定[N];齐齐哈尔日报;2008年
中国博士学位论文全文数据库 前10条
1 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
2 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
3 段瑞雪;基于依存关系的用户意图的研究[D];北京邮电大学;2011年
4 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
5 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
6 彭艳;短语结构语法与依存语法的心理现实性研究[D];上海外国语大学;2007年
7 唐秀玲;论话题及其在汉语语法分析中的应用[D];上海师范大学;1997年
8 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
9 徐艳华;现代汉语实词语法功能考察及词类体系重构[D];南京师范大学;2006年
10 刘水;融入头—修饰词调序模型的短语统计机器翻译方法研究[D];哈尔滨工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 尹鹏;基于SVM的中文组块间依存关系分析[D];大连理工大学;2006年
2 高玲玲;基于依存语法的汉语句法分析研究[D];中国海洋大学;2009年
3 金泉;日语长句子的句法分析[D];大连理工大学;2004年
4 任晓娜;基于统计的汉语依存句法分析研究[D];沈阳航空航天大学;2011年
5 皮晓峰;基于概率上下文无关语法的句法分析研究与实现[D];电子科技大学;2005年
6 刘琍;“程度副词+名词”的语义、语用和句法分析[D];四川师范大学;2005年
7 金天;论汉语及英语中否定歧义的消除[D];广东外语外贸大学;2007年
8 郎文静;规则与统计相结合的汉语依存句法分析技术研究及其应用[D];沈阳航空航天大学;2012年
9 张萍;现代汉语标语语法研究[D];南京师范大学;2006年
10 成姣;日语依存句法分析技术研究[D];沈阳航空航天大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026