收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

指代消解中待消解项识别研究

陈九昌  
【摘要】: 指代消解是自然语言处理的重点和难点之一,在信息抽取,文本摘要等应用中都涉及到指代消解问题。待消解项识别是指代消解的一个子任务,是制约指代消解性能的关键要素之一,也是目前指代消解研究的一个重要内容。 本文深入探讨了多种待消解项识别方法,如规则方法、特征方法、树核函数方法等,并重点探索了依存关系理论驱动的待消解项识别,尝试使用复合核函数将特征信息和结构化信息有机结合起来进行待消解项识别。 在规则方法研究中,分析各类别待消解项所具有的特点,从语法、句法等角度归纳出较为有效的启发式规则。 在特征方法研究中,为每个类别的待消解项制定既符合自身特点又包含上下文信息的特征集,使用机器学习方法构造待消解项识别分类器,将其作为过滤器加入指代消解平台,使指代消解平台的F值提高了0.8~2.2。 在树核函数方法研究中,重点研究了结构化信息的获取问题,即句法树的裁剪,提出了左右扩展策略、层次延伸策略和动态扩展策略。在ACE2003英文语料上的实验表明,动态扩展策略取得了较好的效果。基于动态扩展树的待消解项识别分类器能将指代消解平台的F值提高0.6~1.7。句法树的裁剪是基于树核函数的待消解项识别方法的核心问题,本文提出了基于依存关系的句法树裁剪策略,与其他研究人员的成果相比,它能够更好的获取识别待消解项所需的结构化信息,同时能有效滤去噪音,因此基于依存关系的待消解项识别分类器取得了最佳的性能,将其作为过滤器加入指代消解平台后,基准平台的F值提高了2.4~3.6。 本文还对基于树核函数的待消解项识别方法做了进一步研究,内容包括:尝试将待消解项识别分类器的判断结果作为指代消解的一个特征、基于依存树的待消解项识别研究、基于复合核函数的待消解项识别研究。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
2 陈九昌;孔芳;朱巧明;周国栋;;基于树核函数的“it”待消解项识别研究[J];中文信息学报;2010年05期
3 王晓斌,周昌乐;基于语篇表述理论的汉语人称代词的消解研究[J];厦门大学学报(自然科学版);2004年01期
4 史树敏;黄河燕;刘东升;;自然语言文本指代消解技术研究[J];计算机科学;2007年12期
5 王海东;谭魏璇;李艳翠;周国栋;;基于树核函数的代词指代消解[J];计算机工程;2009年15期
6 孔芳;周国栋;朱巧明;钱培德;;指代消解综述[J];计算机工程;2010年08期
7 谭魏璇;孔芳;王海东;周国栋;;使用树核函数进行中文代词消解的研究[J];计算机工程与应用;2010年24期
8 吴敏;;指代消解在普通语言学理论与课程实践上的应用研究[J];大家;2010年11期
9 麦范金;李东普;甘国庆;;基于指代消解的自动文摘方法研究[J];情报理论与实践;2010年10期
10 张 威,周昌乐;汉语语篇理解中元指代消解初步[J];软件学报;2002年04期
11 于海滨;秦兵;刘挺;郎君;;命名实体识别和指代消解在文摘系统中的应用[J];计算机应用研究;2006年04期
12 李艳翠;杨勇;周国栋;朱巧明;;基于支持向量机的英语名词短语指代消解[J];计算机工程;2009年03期
13 孔芳;朱巧明;周国栋;钱培德;;基于中心理论的指代消解研究[J];计算机科学;2009年06期
14 陈九昌;孔芳;朱巧明;周国栋;;指代消解中代词待消解项识别研究[J];计算机应用与软件;2011年03期
15 胡乃全;孔芳;王海东;周国栋;朱巧明;;基于最大熵模型的中文指代消解系统实现[J];计算机应用研究;2009年08期
16 王海东;胡乃全;孔芳;周国栋;;基于树核函数的英文代词消解研究[J];中文信息学报;2009年05期
17 钟丹;朱倩;李梅;程显毅;;人称名词短语单复数信息和最大熵模型的指代消解[J];江南大学学报(自然科学版);2009年06期
18 庞宁;杨尔弘;;基于统计模型与规则的指代消解研究[J];太原科技;2007年05期
19 许荣华;吴刚;李培峰;朱巧明;;基于指代消解的中文事件融合方法[J];计算机应用;2009年08期
20 董国志;朱玉全;程显毅;;中文人称代词指代消解的研究[J];计算机应用研究;2011年05期
中国重要会议论文全文数据库 前10条
1 罗云飞;李国臣;;采用优先选择策略的中文人称代词的指代消解[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 郎君;刘挺;秦兵;;基于决策树的中文名词短语指代消解[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 谭斌;;指代消解的原理和实现方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
4 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 宋丹;师庆辉;薛德军;林鸿飞;;术语同义词的自动抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 王海东;谭魏旋;周国栋;;语义角色在指代消解中的研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
7 臧翰芬;韦向峰;张全;;基于语义结构平行的汉语人称代词消解[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 刘茂福;金可佳;姬东鸿;张晓龙;;统计与规则相结合的指代消解在事件自动文摘中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 梅铮;王厚峰;;汉语人称代词消解的前端处理[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 金立;肖家燕;;面向信息处理的汉语指代分析——SDRT 视角[A];第二届海峡两岸逻辑教学学术会议专辑[C];2006年
中国博士学位论文全文数据库 前10条
1 孔芳;指代消解关键问题研究[D];苏州大学;2009年
2 孙珊珊;向心理论的参数设定及其在英汉指代消解中的应用研究[D];上海外国语大学;2011年
3 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
4 李凡;Rough集理论及其应用中若干问题的研究[D];电子科技大学;2008年
5 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
6 段嫚娟;向心理论的参数化研究及其在汉语指代消解中的应用[D];上海外国语大学;2006年
7 杨勃;深海钴结壳近距离回声识别研究[D];中南大学;2010年
8 周代英;雷达目标一维距离像识别研究[D];电子科技大学;2001年
9 王正群;手写体汉字识别研究[D];南京理工大学;2001年
10 张勇;新型胺基配体的合成与结构及卟啉和金属卟啉对生物分子的识别研究[D];山西大学;2004年
中国硕士学位论文全文数据库 前10条
1 陈九昌;指代消解中待消解项识别研究[D];苏州大学;2010年
2 黄李伟;中文零指代消解研究[D];苏州大学;2010年
3 陆长生;中文跨文档指代消解的研究与实现[D];苏州大学;2010年
4 倪吉;中文人名跨文档指代消解研究[D];苏州大学;2011年
5 刘福君;基于指代消解的自动文摘研究[D];安徽大学;2012年
6 罗云飞;中文人称代词指代消解系统的研究与实现[D];山西大学;2005年
7 杨勇;基于特征向量的名词短语指代消解研究[D];苏州大学;2008年
8 李艳翠;语义信息在指代消解中的应用研究[D];苏州大学;2008年
9 徐立洋;领域自然语言理解中的代词消解在机械产品需求分析中的应用[D];西安电子科技大学;2007年
10 韩东初;基于自然语言分层结构的文本信息隐藏算法研究[D];湖南科技大学;2008年
中国重要报纸全文数据库 前10条
1 于洋 田野;生物分子识别研究取得新成果[N];吉林日报;2011年
2 本报特约记者 王握文 本报记者 仇方迎;书写雷达目标识别研究新篇章[N];科技日报;2005年
3 阳光;我国生物分子识别研究获可喜成果[N];中国医药报;2006年
4 本版编辑 中国科学院计算技术研究所数字媒体研究中心 山世光 陈熙霖 高文 徐昕 刘洪宇;你的脸,你的身份证明[N];中国计算机报;2006年
5 王宇;技术开拓市场文通推动OCR产业化[N];科技日报;2006年
6 东北证券有限责任公司 张宗新 沈正阳;内幕信息操纵、市场反应及识别研究[N];证券时报;2006年
7 陈瑜唐婷;让计算机会看、会听、会说、会思考[N];科技日报;2007年
8 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
9 记者 刘云涛;33项医药科技项目获2004’国家科技奖励[N];中国医药报;2005年
10 记者 董福;中科院将加强自动控制技术的研究力量[N];北京科技报;2002年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978