收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

指代消解关键问题研究

孔芳  
【摘要】: 随着计算机技术和互联网的迅速发展,各种信息呈爆炸式增长,人们对信息精确定位的需求促进了自然语言处理技术的研究。指代消解是自然语言处理的重点和难点之一,在文本摘要、机器翻译、多语言信息处理和信息抽取等诸多应用中都涉及到指代消解问题。而指代消解又综合了多种自然语言处理技术,它的解决依赖于词性标注、命名实体识别、名词短语识别、句法分析、语义分析等众多相关技术。 本文首先深入分析了现有的指代消解技术,并对其进行了归纳总结,给出了目前指代消解领域主要存在的问题和不足,并进一步给出了该领域当前的研究热点和趋势。作为研究基础,本文参考Soon等(2001)给出的经典指代消解基本框架构建了一个性能良好的指代消解基准平台,与国际上一些出色的指代消解系统相比,该平台在MUC-6和ACE2003上的性能均达到了国际领先水平。在此基础上,本文从以下三方面展开了深入研究: 第一,基于中心理论的指代消解研究。在中心理论的指导下,借助语义角色将中心理论从语法层扩展到语义层,并提取了与之相关的三组特征:语义角色特征,代词阶特征和代词子类别特征。在ACE 2003语料上进行的各类实验都表明,这三组特征能极大地提升了指代消解的性能,特别是代词消解的性能。同时,实验也表明,它们不仅对短距离指代关系的消解有益,对长距离指代关系的消解也很有帮助。 第二,基于树核函数的指代消解研究。在深入研究平面特征的基础上对结构化信息在指代消解中的应用进行了探索。重点研究了多种捕获结构化信息的方案,并通过实验分析了它们的优缺点。例如,在中心理论的指导下,增强了先行语候选词所在位置的句法描述;根据双候选模型,增加了先行语候选词的竞争者信息;在结构化信息中引入语义角色及代词类别等信息。在ACE 2004英文语料中的实验表明,基于树核函数的方法大大提高了英文指代消解的性能,特别是当前句代词消解的性能。同时,在ACE 2005中文语料中的实验表明,基于树核函数的方法同样大大提高了中文指代消解的性能,这表明结构化信息对指代消解而言是非常重要的,而且是语言无关的。 第三,指代消解中待消解项的自动识别研究。探讨了基于规则、平面特征和树核等三种待消解项识别方法,并将这三种待消解项识别方法分别应用于指代消解,通过对实验数据的分析阐述了待消解项识别对指代消解的作用。


知网文化
【相似文献】
中国期刊全文数据库 前10条
1 李凡;刘启和;李洪伟;;基于Fuzzy Rough集模型的汉语人称代词消解[J];计算机科学;2010年01期
2 孔芳;周国栋;朱巧明;钱培德;;指代消解综述[J];计算机工程;2010年08期
3 盛娜;;国际金融中心研究综述——从跨国银行地区总部角度[J];金卡工程(经济与法);2010年05期
4 伍守芹;李晓昀;;信息抽取技术研究与探讨[J];福建电脑;2010年04期
5 刘枫;;传播研究中的“中心理论贫乏现象”分析[J];新闻界;2010年02期
6 周婉萍;;提高职业学校图书馆管理的顾客满意度[J];农业图书情报学刊;2010年08期
7 刘玉玲;辛国江;;篇章层自然语言数字水印方法[J];计算机工程;2010年12期
8 吴敏;;指代消解在普通语言学理论与课程实践上的应用研究[J];大家;2010年11期
9 谭魏璇;孔芳;王海东;周国栋;;使用树核函数进行中文代词消解的研究[J];计算机工程与应用;2010年24期
10 麦范金;李东普;甘国庆;;基于指代消解的自动文摘方法研究[J];情报理论与实践;2010年10期
中国重要会议论文全文数据库 前10条
1 何靖;陈翀;闫宏飞;;开放域问答系统研究综述[A];第六届全国信息检索学术会议论文集[C];2010年
2 张伟男;张宇;刘挺;;基于中心理论的中文对话省略恢复研究[A];第六届全国信息检索学术会议论文集[C];2010年
3 伊力亚尔·加尔木哈买提;尼亚子别克·阿不都加勒力;;哈萨克文自动文本摘要方法浅谈[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 晏国祥;;透析“营销是科学还是艺术”之争[A];中国市场营销创新与发展学术研讨会论文集[C];2009年
5 桂卓民;何婷婷;陈劲光;李芳;;一种面向查询的多文档自动文摘系统实现方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 刘茂福;金可佳;姬东鸿;张晓龙;;统计与规则相结合的指代消解在事件自动文摘中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 伍学进;;试论城市的窄街道、小街区系统[A];城市规划和科学发展——2009中国城市规划年会论文集[C];2009年
8 杜志娟;;多中心理论视角下公共体育服务供给模式的研究[A];全民健身科学大会论文摘要集[C];2009年
9 谭斌;;指代消解的原理和实现方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
10 王海东;谭魏旋;周国栋;;语义角色在指代消解中的研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前6条
1 王会寨;公共服务视野下的中国体育行政管理体制改革[D];北京体育大学;2009年
2 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
3 段嫚娟;向心理论的参数化研究及其在汉语指代消解中的应用[D];上海外国语大学;2006年
4 秦玲;草炭保水保肥特性与葡萄根区不同施用模式效应的研究[D];西北农林科技大学;2005年
5 杨永福;“规则”的分析与建构:制度的社会网络基础[D];武汉理工大学;2003年
6 卢再奇;弹载毫米波雷达目标识别实现技术研究[D];国防科学技术大学;2002年
中国硕士学位论文全文数据库 前10条
1 陆长生;中文跨文档指代消解的研究与实现[D];苏州大学;2010年
2 陈九昌;指代消解中待消解项识别研究[D];苏州大学;2010年
3 孙中友;基于主题的事件融合技术的研究与实现[D];苏州大学;2010年
4 黄李伟;中文零指代消解研究[D];苏州大学;2010年
5 谭魏璇;命名实体与基本名词短语识别研究[D];苏州大学;2010年
6 陈帅;面向篇章的代词指代消解及其在机械产品设计中的应用[D];西安电子科技大学;2009年
7 吴波;我国转型时期多元参与城市治理模式研究[D];电子科技大学;2009年
8 徐向科;转型期乡村庇护网络与基层治理变迁研究[D];复旦大学;2009年
9 万洪杰;惠特曼《草叶集》的女性主义解读[D];中国海洋大学;2009年
10 金可佳;统计与规则相结合的指代消解[D];武汉科技大学;2009年
中国重要报纸全文数据库 前10条
1 通讯员 喀组研;我区积极推进学习型领导班子建设[N];喀什日报(汉);2010年
2 通讯员 孙利;灌云审计局打造廉洁型审计机关[N];连云港日报;2010年
3 通讯员 杨和;英吉沙以良好学风促干部作风转变[N];喀什日报(汉);2010年
4 齐立民 张士军;创建学习型党组织当典范[N];北大荒日报;2010年
5 任俊青;立足“三个加强”提升党建水平[N];北大荒日报;2010年
6 通讯员 喀组研;我区组织系统扎实开展“四带头四提高”活动[N];喀什日报(汉);2010年
7 记者 张静伟;市中法学习贯彻干部选拔任用“四项监督制度”[N];拉萨晚报;2010年
8 杨宏军;开展“五个创建”活动 推动学习型组织建设[N];北大荒日报;2010年
9 张肖雯 编译;“自私的声音”:语言学中的达尔文主义[N];中国社会科学报;2010年
10 洛文;美媒:中国发展不能步美国后尘[N];国防时报;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978