收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于事件的多文档自动文摘系统的研究

桂卓民  
【摘要】: 互联网上对一个简单事件的咨询,就可能返回成百上千的网页,而且其中有大量重复的网页、大量不相关的数据,用户不得不花费很多的精力去寻找有用的结果。这迫切需要一个帮助人们快速浏览信息的工具,该工具不仅提供的是直接的文档;而且是经过加工整理,包含这些文档的重要、全面的信息。 多文档自动文摘技术就是将大量采集到的相关主题信息浓缩为一个包含该主题下的所有全面内容,并且内容简练、组织良好、冗余低的摘要,将人们从繁琐、冗余的信息中解脱出来。其研究目的在于解决从海量数据中获取有用信息的困难,提高信息获取及浏览的速度、适应不同用户对信息的个性化需求。 本文主要针对于互联网上的事件网页信息,开发一个完整的基于事件的多文档自动文摘系统。该系统能够获取事件并从互联网上采集相关的事件网页信息,并整合相关的信息,压缩成事件的自动摘要的形式提交给用户。本文在以下几个方面展开相关研究: 第一,设计出了一个基于Internet的网络事件的中文自动文摘系统。该系统采用元搜索引擎方法从网络中获取一定时间内的事件,用户也可以输入感兴趣的事件话题;然后针对于事件话题,调用搜索引擎采集相关的事件网页信息;最后利用多文档自动文摘技术生成摘要提交给用户。 第二,在事件多文档摘要过程中,通过倒几率比算法评价词语权重来抽取权重最高的前25个特征项作为相应事件的相关特征集;提出利用句子内部和外部两方面的特征综合衡量句子的权值的策略;在摘要句抽取时,提出了基于字符串间的匹配、句子的词义相似、句子的词义相似等特征融合的方法计算句子间的相似性,去掉冗余句。 第三,在系统性能评价方面,采用百度百科的事件解释或人工的结果作为标准文摘,利用句子平均重合率、国际多文档自动文摘比赛标准的评测体系ROUGE-2和ROUGE-4等评价指标来衡量系统摘要的质量。


知网文化
【相似文献】
中国期刊全文数据库 前19条
1 刘凯;王红玲;;基于篇章修辞结构的自动文摘连贯性研究[J];中文信息学报;2019年01期
2 袁龙云;张琳;;基于主题模型与冗余控制的中文多文档自动文摘技术研究[J];现代计算机(专业版);2017年14期
3 倪维健;刘彤;曾庆田;赵华;汤建渝;;基于非平衡数据分类的单文档自动文摘方法[J];计算机工程与科学;2012年04期
4 付茜;;自动文摘综述[J];中国美容医学;2012年16期
5 杨建林;自动文摘的逻辑解释[J];情报理论与实践;2002年02期
6 汤晓鲁;李旎;;手工文摘的评价与自动文摘的产生[J];贵图学刊;1998年02期
7 索红光;梁玉环;刘玉树;;基于时间戳的多文档自动文摘[J];计算机工程;2007年16期
8 孙晓腾;李学明;;基于论文关键词和篇章结构的自动文摘抽取方法[J];现代计算机(专业版);2018年13期
9 王海;胡珀;;基于遗传算法的查询导向式自动文摘[J];微计算机信息;2009年28期
10 刘楚达,孙海涛;一种基于统计的中文自动文摘方法[J];湖南农业大学学报(自然科学版);2001年06期
11 王建波;王开铸;;自动文摘系统—句子级信息处理研究[J];情报科学;1991年06期
12 徐超;王萌;;基于局部主题关键句抽取的多文档自动文摘方法[J];计算机光盘软件与应用;2013年18期
13 徐永东;徐志明;王晓龙;;基于信息融合的多文档自动文摘技术[J];计算机学报;2007年11期
14 王红玲;张明慧;周国栋;;主题信息的中文多文档自动文摘系统[J];计算机工程与应用;2012年25期
15 卫佳君;宋继华;;自动文摘的方法研究[J];计算机技术与发展;2011年08期
16 黄河笑,郭俊文;中文科技文献自动文摘系统的研究[J];现代情报;1996年03期
17 王建波,杜春玲,王开铸;基于篇章理解的自动文摘研究[J];中文信息学报;1995年03期
18 王红玲;周国栋;朱巧明;;面向冗余度控制的中文多文档自动文摘[J];中文信息学报;2012年02期
19 胡迁;黄青松;刘利军;冯旭鹏;;基于自动文摘的答案生成方法研究[J];计算机应用与软件;2018年12期
中国重要会议论文全文数据库 前10条
1 刘茂福;金可佳;姬东鸿;张晓龙;;统计与规则相结合的指代消解在事件自动文摘中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
2 王红玲;黄超超;张明慧;周国栋;;面向冗余度控制的中文多文档自动文摘[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 王小磊;张瑾;许洪波;;基于交互增强原理的多文档自动文摘算法[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
4 卢冶;林鸿飞;赵晶;;中文自动文摘系统的综合评价模式[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 李立燕;杨国纬;;中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
6 胡珀;;基于图模型的多文档自动文摘(英文)[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 张明慧;王红玲;周国栋;;LDA主题驱动的中文多文档自动文摘方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
8 王萌;王晓荣;李春贵;唐培和;;基于局部与全局信息的自动文摘算法[A];广西计算机学会2007年年会论文集[C];2007年
9 邵伟;何婷婷;胡珀;肖华松;;一种面向查询的多文档文摘句选择策略[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 万敏;罗振声;郭玉箐;;自动文摘系统中的意义段划分问题研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 刘德喜;基于基本要素的多文档自动文摘研究[D];武汉大学;2007年
2 徐永东;多文档自动文摘关键技术研究[D];哈尔滨工业大学;2007年
3 李鹏;面向主题的多文档自动文摘关键技术研究[D];上海交通大学;2013年
4 韦福如;基于图模型多文档自动文摘研究[D];武汉大学;2009年
5 张琳;基于引用聚类的多文档自动文摘技术研究[D];大连海事大学;2013年
6 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
7 陈劲光;基于云模型的中文面向查询多文档自动文摘研究[D];华中师范大学;2011年
8 赵林;面向查询的多文档自动文摘关键技术研究[D];复旦大学;2008年
9 胡珀;融合上下文信息的自动文摘研究[D];武汉大学;2013年
10 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 桂卓民;基于事件的多文档自动文摘系统的研究[D];华中师范大学;2010年
2 谢静芝;面向循证医学的多文档自动文摘技术研究[D];大连海事大学;2010年
3 万欣;基于自动文摘的辅助文档撰写系统研究与实现[D];北京邮电大学;2019年
4 刘凯;基于篇章结构理论的单文档自动文摘研究[D];苏州大学;2018年
5 任宇;基于观点挖掘主题模型的多文档自动文摘技术研究[D];吉林大学;2018年
6 王炜;基于深度学习的中文单文档自动文摘方法研究[D];华中师范大学;2018年
7 张洪荣;中文自动文摘关键技术研究与实现[D];哈尔滨工业大学;2018年
8 王帆;基于语义聚类的新闻多文档自动文摘[D];华中科技大学;2017年
9 孙晓腾;基于关键词过滤和篇章结构的中文自动文摘研究[D];重庆大学;2018年
10 董雯;基于混合神经网络的单文档自动文摘方法研究[D];浙江理工大学;2019年
中国重要报纸全文数据库 前1条
1 孙菲;中小企业信息化有了“依靠”[N];中国企业报;2000年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978