收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

网络新闻多文档自动摘要技术研究

许旭阳  
【摘要】:互联网的日益普及和计算机技术的不断发展给人们获取信息带来了极大的便利,但是面对海量的网络数据环境,如何获取感兴趣、有用的知识仍然是一个亟待解决的问题。在众多的研究方法中,多文档自动摘要被视为解决上述问题的有效工具之一,它是利用计算机将同一话题下的多个文档描述的主要内容通过信息压缩技术提炼为一个短文的自然语言处理技术,在军事和民用方面都具有极其重要的实用意义。本文主要研究网络新闻多文档自动摘要技术,首先从网络新闻话题中抽取相关的事件,然后采用不同的技术组织事件,最终生成摘要。论文的研究成果如下: (1)研究了时间表达式识别技术,提出一种基于条件随机场与自定义规则的时间表达式识别方法。该方法针对传统时间识别方法单一、应用领域局限等缺点,采用条件随机场对时间表达式进行初步识别;然后自定义规则对错识别和漏识别的时间表达式进行修正。实验结果表明,该方法有效提高了时间表达式识别的准确率和召回率,为时间表达式的识别建立了一种弹性的分析模型。 (2)研究了事件抽取技术,提出一种基于事件实例驱动的新闻文本事件抽取方法。该方法针对事件触发词或事件元素驱动的事件抽取方法存在的正反例不平衡和数据稀疏问题,采用事件实例进行驱动;然后引入聚类的思想完成新闻文本集中事件的有效抽取,突破了传统方法对事件类别限制的局限性。实验结果表明,该方法显著提高了新闻文本集中事件抽取的性能,是一种有效的事件抽取方法。 (3)研究了多文档自动摘要技术,提出一种基于事件抽取的多文档自动摘要方法。该方法针对目前以段落或句子聚类的摘要方法存在的冗余问题,采用事件抽取技术将原始文档转化为以事件为单位的内容逻辑划分;然后通过主旨事件抽取、排序及润色,生成摘要。实验结果表明,该方法所生成的摘要更贴近人的理解,从而有效地帮助用户及时、准确、便捷地获取事件的来龙去脉。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 史磊,王永成;英文文献自动摘要系统研究[J];情报学报;1999年06期
2 李蕾,孙春葵,杨晓兰,钟义信;一种特定领域中文自动摘要系统[J];北京邮电大学学报;2000年01期
3 张雷生,万绍俊,许鹏文;简单中文自动摘要系统研究[J];装备指挥技术学院学报;2004年03期
4 刘洋,王永成;基于Web服务自动摘要系统的安全实现方案[J];计算机工程与应用;2005年15期
5 陈桂林,王永成;Internet网络信息自动摘要的研究[J];高技术通讯;1999年02期
6 谭种;陈跃新;;自动摘要方法综述[J];情报学报;2008年01期
7 ;计算机中文文本自动摘要系统通过专家鉴定[J];预防医学文献信息;1996年03期
8 王继成 ,武港山 ,周源远 ,张福炎;一种篇章结构指导的中文Web文档自动摘要方法[J];计算机研究与发展;2003年03期
9 张筱丹;胡学钢;;基于向量空间模型的自动摘要冗余处理研究[J];合肥工业大学学报(自然科学版);2010年09期
10 黄水清;李志燕;梁刚;;面向计算机类文献的自动摘要系统的研究与实现[J];图书与情报;2006年03期
11 陈珂;殷凡;;中文自动摘要综述[J];福建电脑;2007年02期
12 王永成;刘功申;刘传汉;胡佩华;孙展;;论文本的自动摘要[J];中国索引;2003年02期
13 阿热帕提·尕依提;维尼拉·木沙江;;基于统计的维吾尔文网页自动摘要提取研究[J];电脑知识与技术;2011年01期
14 沈洲,王永成,韩客松;一种基于主题敏感辞分析的新闻文献自动摘要系统的研究与实践[J];高技术通讯;2001年09期
15 刘郑;杜祝平;;浅析英文自动摘要技术[J];魅力中国;2008年28期
16 王麒;江开忠;杨静;顾君忠;;基于领域本体的文档自动摘要算法[J];华东师范大学学报(自然科学版);2007年05期
17 王永成,王继才;中文文本摘要的自动编制[J];微型电脑应用;1998年02期
18 张奇,黄萱菁,吴立德;一种新的句子相似度度量及其在文本自动摘要中的应用[J];中文信息学报;2005年02期
19 耿焕同,蔡庆生,赵鹏,于琨;一种基于词共现图的文档自动摘要研究[J];情报学报;2005年06期
20 尹存燕;戴新宇;陈家骏;;Internet上文本的自动摘要技术[J];计算机工程;2006年03期
中国重要会议论文全文数据库 前10条
1 章彦星;张铭;邓志鸿;;基于特征的用户评论自动摘要[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 李芳;何婷婷;;面向查询的多模式自动摘要研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 苗家;马军;陈竹敏;;一种基于HITS算法的blog文摘方法[A];第六届全国信息检索学术会议论文集[C];2010年
4 李立燕;杨国纬;;中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 杨潇;马军;杨同峰;杜言琦;邵海敏;;基于主题模型LDA的多文档自动摘要[A];第五届全国信息检索学术会议论文集[C];2009年
6 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
7 王荀;李素建;宋涛;姜伯平;;服务于内容侧面发现的框架识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 多拉;扎西加;欧珠;大罗桑朗杰;;信息处理用藏文词类及标记集规范(征求意见稿)[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 宋锐;林鸿飞;;面向中文新闻领域的移动摘要系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 陈杰;;应用智能搜索 实现数据挖掘[A];中国新闻技术工作者联合会五届一次理事会暨学术年会论文集(上篇)[C];2009年
中国博士学位论文全文数据库 前10条
1 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
2 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
3 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
4 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
5 龙华;定义问答检索关键技术研究[D];重庆大学;2010年
6 陈曦;基于子串的文本分割与主题标注研究[D];武汉大学;2009年
7 金锋;文档摘要算法的研究与应用[D];清华大学;2011年
8 钦小平;低维磁性模型中钉扎—退钉扎相变的Monte Carlo模拟研究[D];浙江大学;2012年
9 张晓峰;基于条件随机场的目标提取[D];华东师范大学;2012年
10 刘春原;基于GIS系统的岩土参数随机场特性研究[D];天津大学;2003年
中国硕士学位论文全文数据库 前10条
1 许旭阳;网络新闻多文档自动摘要技术研究[D];解放军信息工程大学;2011年
2 阿热帕提·尕依提;基于统计的维吾尔网页自动摘要提取研究[D];新疆大学;2011年
3 余博;基于维基百科的多文档自动摘要系统研究[D];武汉科技大学;2011年
4 商玥;面向概念查询的生物医学多文档摘要技术研究[D];大连理工大学;2011年
5 李阜;基于滑窗取词的单文档自动摘要技术研究[D];国防科学技术大学;2010年
6 章芝青;基于语义的单文档自动摘要研究[D];浙江大学;2010年
7 熊芝;中文网页自动摘要系统的设计与实现[D];华南理工大学;2011年
8 李振鹏;针对UGC数据进行的数据挖掘的研究与实现[D];北京邮电大学;2013年
9 张文静;搜索引擎返回结果的自动摘要研究[D];中国石油大学;2010年
10 鲁凡;基于分形理论的自动摘要[D];吉林大学;2004年
中国重要报纸全文数据库 前9条
1 马海兵;网络舆情及其分析技术[N];光明日报;2007年
2 海量智能计算技术研究中心 霍刚;新兴技术为互联网加速[N];计算机世界;2007年
3 本报记者 张彤;让计算机说中国话[N];网络世界;2004年
4 本报记者 张晔通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
5 谢国宁 谢敬爱;天津临空产业等待起飞[N];中国现代企业报;2006年
6 ;谷尼国际:精确监控网络舆情[N];中国计算机报;2009年
7 ;杨元元还在飞的民航局长[N];市场报;2006年
8 ;线点科技:轻松管理互联网[N];中国计算机报;2009年
9 本期专家 龚可;专家坐堂之软件篇[N];电脑报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978