收藏本站
《武汉科技大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

统计与规则相结合的指代消解

金可佳  
【摘要】: 随着互联网信息的飞速发展,信息的增加在满足人们对信息需求的同时也给人们快速、准确的查找所需要的信息带来了一定的难度。在这种情况下,自动文摘系统成为研究的热点。 在现有的自动文摘中,主要以句子抽取式为主,基于事件的自动文摘就是其中的一种,其主要思想是将语料中的事件项抽取出来,根据语义资源确定抽取出来的事件项之间的语义关系,然后根据语义关系计算每个事件项的重要性,进而计算事件项所在句子的重要性并进行排序,最后按序抽取句子组成摘要。根据自动文摘领域对事件项通用的定义,这里所说的事件项是位于两个命名实体之间的动词或含有动词意义的名词。 在正常语料中,会出现很多的代词来指代前面已经表达过的名词或命名实体,根据事件项的定义,在抽取事件项的时候,就会将位于代词之间或代词和名词之间的事件项忽略,从而减少了抽取出来的事件项的数量,这样就会降低自动文摘的性能。所以对语料中的代词进行消解成为自动文摘性能提高的关键。 本文利用基于规则和统计相结合的方法对自动文摘源语料中的代词进行消解,首先利用单纯的规则方法对语料中指代命名实体的代词进行消解,通过对召回率和准确率以及消解后的文章进行分析,可以看出其不足在于不能很好的确定哪些代词指代命名实体,针对这一问题将统计中的最大熵的方法和规则相结合进行消解,利用最大熵的方法来弥补单纯规则的方法所出现的不足,准确确定哪些代词需要消解,提高消解的准确率和召回率,增加语料中命名实体的数量,从而尽可能多的抽取出语料中的事件项来提高自动文摘的性能。实验结果表明利用消解后的语料生成的摘要比利用消解前的语料生成的摘要性能提高了近8.5%,并且文摘的可读性,信息量也有明显的提高。
【学位授予单位】:武汉科技大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP391.1

【相似文献】
中国期刊全文数据库 前10条
1 杨小献,赵云娣,谢自美;基于规则的柔性综合统计报表技术[J];计算机应用研究;2005年12期
2 韩敏;孙燕楠;许士国;;一种模糊逻辑推理神经网络的结构及算法设计[J];控制与决策;2006年04期
3 陈永府;杨小献;黄正东;陈立平;;基于规则的数据收集研究[J];计算机工程与设计;2007年01期
4 庄越挺;何志均;;一个专家系统开发环境核心的设计与实现[J];计算机应用与软件;1993年02期
5 周颖;;对规则取舍问题的研究[J];计算机科学;2003年06期
6 胡玉荣;王丽珍;;一种基于属性值重要性的启发式值约简算法[J];荆门职业技术学院学报;2006年03期
7 周洪伟;张来顺;原锦辉;;用遗传算法改进基于专家系统的入侵检测系统[J];计算机工程与设计;2007年09期
8 周华平;;防火墙中规则的翻译及检测方法的研究[J];计算机技术与发展;2007年11期
9 李建省;张美凤;;地铁闸机控制系统中人体识别技术的研究与应用[J];电气传动自动化;2008年01期
10 董明明;巩青歌;;Snort规则集的优化方法[J];计算机安全;2009年08期
中国重要会议论文全文数据库 前10条
1 刘茂福;金可佳;姬东鸿;张晓龙;;统计与规则相结合的指代消解在事件自动文摘中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
2 罗云飞;李国臣;;采用优先选择策略的中文人称代词的指代消解[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 郎君;刘挺;秦兵;;基于决策树的中文名词短语指代消解[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 谭斌;;指代消解的原理和实现方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
6 宋丹;师庆辉;薛德军;林鸿飞;;术语同义词的自动抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 李文;姜宏涛;;一种自组织模糊缺省模型[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
8 王海东;谭魏旋;周国栋;;语义角色在指代消解中的研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
9 臧翰芬;韦向峰;张全;;基于语义结构平行的汉语人称代词消解[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
10 梅铮;王厚峰;;汉语人称代词消解的前端处理[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国重要报纸全文数据库 前10条
1 中华女子学院计算机系 刘志斌;例解Oracle Database Vault[N];计算机世界;2007年
2 高安;别让防火墙成摆设[N];中国计算机报;2001年
3 乐天 ;智胜新的恶意软件[N];中国计算机报;2005年
4 梁冰;BRM产品走向成熟[N];计算机世界;2004年
5 本报记者 黄果;自信从何而来?[N];计算机世界;2000年
6 编译 方红琴;企业级IM迈过安全门槛[N];计算机世界;2004年
7 肖滨;在辩论中选择宪法规则[N];南方周末;2006年
8 夏沅;金融防火墙的规则设计[N];金融时报;2004年
9 何仁杰 梁冰;用规则引擎替换代码[N];计算机世界;2004年
10 戈;Websense完成对SurfControl整合[N];电脑商报;2008年
中国博士学位论文全文数据库 前10条
1 孙珊珊;向心理论的参数设定及其在英汉指代消解中的应用研究[D];上海外国语大学;2011年
2 孔芳;指代消解关键问题研究[D];苏州大学;2009年
3 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
4 李凡;Rough集理论及其应用中若干问题的研究[D];电子科技大学;2008年
5 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
6 郑裕峰;高速包分类协处理器及网络平台研究[D];中国科学技术大学;2007年
7 朱传军;车间不确定信息的约简及知识发现研究[D];华中科技大学;2006年
8 向军;网络处理器并行线速处理关键技术研究[D];华南理工大学;2010年
9 郑凯;高性能IP路由查找和分组分类技术的研究[D];清华大学;2006年
10 龚向阳;下一代互联网QoS关键技术研究[D];北京邮电大学;2012年
中国硕士学位论文全文数据库 前10条
1 黄李伟;中文零指代消解研究[D];苏州大学;2010年
2 陈九昌;指代消解中待消解项识别研究[D];苏州大学;2010年
3 陆长生;中文跨文档指代消解的研究与实现[D];苏州大学;2010年
4 倪吉;中文人名跨文档指代消解研究[D];苏州大学;2011年
5 金可佳;统计与规则相结合的指代消解[D];武汉科技大学;2009年
6 周小驹;基于流标签的IPv6包分类算法研究[D];北京邮电大学;2010年
7 刘福君;基于指代消解的自动文摘研究[D];安徽大学;2012年
8 刘泓漫;基于图方法的主动数据库规则问题的研究[D];哈尔滨理工大学;2004年
9 裴庆祺;模糊入侵检测技术研究[D];西安电子科技大学;2004年
10 罗云飞;中文人称代词指代消解系统的研究与实现[D];山西大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026