收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于滑窗取词的单文档自动摘要技术研究

李阜  
【摘要】: 在信息检索中应用自动摘要技术,可以减少用户查询所关心信息的时间,提高获取知识和信息的效率。因此,研究能够适应各种文档形式和内容且无需训练的自动摘要技术,有着极其重要的意义。 主题词抽取是自动文摘系统的关键技术之一。一个好的主题词集合可以较好的反应出文档的中心思想,从而为抽取情报中的主题句打下好的基础。本文首先提出了基于滑动窗口的主题词抽取算法,随后建立了基于主题词的无向图,进而对节点重要度进行建模,并提出了主题词权重方差和主题词权重偏移量两个评价指标,以此分析滑动窗口长度对主题词抽取的影响。 主题句抽取直接关系到自动文摘质量的高低,抽取出的主题句集合是自动文摘系统输出结果的最终展现形式。在已抽取出的文档主题词基础之上,本文对基于主题构建的无向图进行扩充,提出基于文档句构建的无向图,将主题句的抽取问题转换为求解无向图中节点的权重问题。通过依次确定无向图的节点、边以及边权重,最终求解其节点的权重。为了确定图的边权重,本文采用空间向量模型对各文档句进行建模,并利用相似度来明确句子间的关系。最后,通过本文所提出的基于句子相似度矩阵的权重模型对文档中各语句的权重进行建模,以得到自动文摘系统的最终输出。 实验表明,本文提出的自动摘要技术,对于提高文本摘要的召回率和准确率是有效的。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 史磊,王永成;英文文献自动摘要系统研究[J];情报学报;1999年06期
2 李蕾,孙春葵,杨晓兰,钟义信;一种特定领域中文自动摘要系统[J];北京邮电大学学报;2000年01期
3 张雷生,万绍俊,许鹏文;简单中文自动摘要系统研究[J];装备指挥技术学院学报;2004年03期
4 刘洋,王永成;基于Web服务自动摘要系统的安全实现方案[J];计算机工程与应用;2005年15期
5 陈桂林,王永成;Internet网络信息自动摘要的研究[J];高技术通讯;1999年02期
6 谭种;陈跃新;;自动摘要方法综述[J];情报学报;2008年01期
7 张筱丹;胡学钢;;基于向量空间模型的自动摘要冗余处理研究[J];合肥工业大学学报(自然科学版);2010年09期
8 陈珂;殷凡;;中文自动摘要综述[J];福建电脑;2007年02期
9 王永成;刘功申;刘传汉;胡佩华;孙展;;论文本的自动摘要[J];中国索引;2003年02期
10 ;计算机中文文本自动摘要系统通过专家鉴定[J];预防医学文献信息;1996年03期
11 王继成 ,武港山 ,周源远 ,张福炎;一种篇章结构指导的中文Web文档自动摘要方法[J];计算机研究与发展;2003年03期
12 黄水清;李志燕;梁刚;;面向计算机类文献的自动摘要系统的研究与实现[J];图书与情报;2006年03期
13 王健;;基于Web的文本自动摘要技术分析[J];科技信息(科学教研);2007年34期
14 阿热帕提·尕依提;维尼拉·木沙江;;基于统计的维吾尔文网页自动摘要提取研究[J];电脑知识与技术;2011年01期
15 张筱丹;胡学钢;;基于Web的新闻文本自动摘要研究[J];阜阳师范学院学报(自然科学版);2009年01期
16 沈洲,王永成,韩客松;一种基于主题敏感辞分析的新闻文献自动摘要系统的研究与实践[J];高技术通讯;2001年09期
17 刘郑;杜祝平;;浅析英文自动摘要技术[J];魅力中国;2008年28期
18 王麒;江开忠;杨静;顾君忠;;基于领域本体的文档自动摘要算法[J];华东师范大学学报(自然科学版);2007年05期
19 王永成,王继才;中文文本摘要的自动编制[J];微型电脑应用;1998年02期
20 张奇,黄萱菁,吴立德;一种新的句子相似度度量及其在文本自动摘要中的应用[J];中文信息学报;2005年02期
中国重要会议论文全文数据库 前10条
1 章彦星;张铭;邓志鸿;;基于特征的用户评论自动摘要[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 李芳;何婷婷;;面向查询的多模式自动摘要研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 苗家;马军;陈竹敏;;一种基于HITS算法的blog文摘方法[A];第六届全国信息检索学术会议论文集[C];2010年
4 李立燕;杨国纬;;中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 杨潇;马军;杨同峰;杜言琦;邵海敏;;基于主题模型LDA的多文档自动摘要[A];第五届全国信息检索学术会议论文集[C];2009年
6 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
7 王荀;李素建;宋涛;姜伯平;;服务于内容侧面发现的框架识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 多拉;扎西加;欧珠;大罗桑朗杰;;信息处理用藏文词类及标记集规范(征求意见稿)[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 宋锐;林鸿飞;;面向中文新闻领域的移动摘要系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 陈杰;;应用智能搜索 实现数据挖掘[A];中国新闻技术工作者联合会五届一次理事会暨学术年会论文集(上篇)[C];2009年
中国博士学位论文全文数据库 前10条
1 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
2 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
3 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
4 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
5 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
6 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
7 龙华;定义问答检索关键技术研究[D];重庆大学;2010年
8 韦福如;基于图模型多文档自动文摘研究[D];武汉大学;2009年
9 李鹏;面向主题的多文档自动文摘关键技术研究[D];上海交通大学;2013年
10 张琳;基于引用聚类的多文档自动文摘技术研究[D];大连海事大学;2013年
中国硕士学位论文全文数据库 前10条
1 李阜;基于滑窗取词的单文档自动摘要技术研究[D];国防科学技术大学;2010年
2 余博;基于维基百科的多文档自动摘要系统研究[D];武汉科技大学;2011年
3 许旭阳;网络新闻多文档自动摘要技术研究[D];解放军信息工程大学;2011年
4 阿热帕提·尕依提;基于统计的维吾尔网页自动摘要提取研究[D];新疆大学;2011年
5 商玥;面向概念查询的生物医学多文档摘要技术研究[D];大连理工大学;2011年
6 章芝青;基于语义的单文档自动摘要研究[D];浙江大学;2010年
7 张文静;搜索引擎返回结果的自动摘要研究[D];中国石油大学;2010年
8 熊芝;中文网页自动摘要系统的设计与实现[D];华南理工大学;2011年
9 李振鹏;针对UGC数据进行的数据挖掘的研究与实现[D];北京邮电大学;2013年
10 鲁凡;基于分形理论的自动摘要[D];吉林大学;2004年
中国重要报纸全文数据库 前9条
1 马海兵;网络舆情及其分析技术[N];光明日报;2007年
2 海量智能计算技术研究中心 霍刚;新兴技术为互联网加速[N];计算机世界;2007年
3 本报记者 张彤;让计算机说中国话[N];网络世界;2004年
4 本报记者 张晔通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
5 ;谷尼国际:精确监控网络舆情[N];中国计算机报;2009年
6 张雪峰;信息检索技术的新视角[N];中华读书报;2005年
7 ;线点科技:轻松管理互联网[N];中国计算机报;2009年
8 河北师大教师 孟俊茂;翻译软件的评测研究[N];中国特产报;2010年
9 ;浙江天宇信息技术有限公司[N];中国计算机报;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978