收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于语义的单文档自动摘要研究

章芝青  
【摘要】:随着互联网和搜索引擎技术的发展普及,人们对于如何在庞大的互联网上高效地获得有价值的信息日益关注。文档自动摘要技术作为人们挑战信息爆炸式增长与信息有效利用之间矛盾的重要武器,受到世界的广泛认可。目前国际上许多学校和企业都在进行文档自动摘要技术的研究,并取得一定成绩,也产生了各种各样的自动摘要应用系统。 但在我国,文档自动摘要技术发展历史比较短。我国文本摘要技术的发展研究还处于初级阶段。国内主要研究基于统计的方法,例如向量空间模型的摘要系统Vector Space Model。而基于语义的研究较少,一是由于语义对于语言学的研究要求较高,还有各种语料库的建立,语义词典的开发相对国外比较落后,因此本文对于语义方面做单文档摘要进行研究。 单文档自动摘要的目标是在原始的文本中通过摘取,提炼主要信息,提供一篇简洁全面的摘要。已有的方法大都是通过统计和机器学习的技术从文本中直接提取出句子。本文主要研究基于语义的单文档自动摘要。首先研究了基于语义的词语相似度计算和句子相似度计算。在此基础上,提出了改进型K-Medoids摘要系统和对称非负矩阵分解的摘要系统。通过两个系统与以往的系统进行试验比对,我们的方法提高了单文档摘要的质量。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 谷列先;丁晓青;;基于人物关系分析的视频自动摘要算法[J];高技术通讯;2010年09期
2 徐晓丹;;基于半监督学习的中文多文档子主题划分[J];浙江师范大学学报(自然科学版);2011年03期
3 黄长伟;;自动文摘技术研究现状分析[J];中外企业家;2011年14期
4 杨刚;;OpenGL程序开发中若干难点解析[J];华北科技学院学报;2011年02期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 章彦星;张铭;邓志鸿;;基于特征的用户评论自动摘要[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 李芳;何婷婷;;面向查询的多模式自动摘要研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 苗家;马军;陈竹敏;;一种基于HITS算法的blog文摘方法[A];第六届全国信息检索学术会议论文集[C];2010年
4 李立燕;杨国纬;;中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 杨潇;马军;杨同峰;杜言琦;邵海敏;;基于主题模型LDA的多文档自动摘要[A];第五届全国信息检索学术会议论文集[C];2009年
6 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
7 王荀;李素建;宋涛;姜伯平;;服务于内容侧面发现的框架识别[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 闫英杰;林鸿飞;杨志豪;;关键词密度分布法在偏重摘要中的应用研究[A];第三届学生计算语言学研讨会论文集[C];2006年
9 余军;杨建武;陈晓鸥;;一种与TDT结合的增量多文档摘要方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 多拉;扎西加;欧珠;大罗桑朗杰;;信息处理用藏文词类及标记集规范(征求意见稿)[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
2 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
3 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
4 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
5 姜岩;面向方面的XML数据管理技术研究[D];东北大学 ;2009年
6 江开忠;上下文感知的Web搜索关键技术研究[D];华东师范大学;2008年
7 刘德喜;基于基本要素的多文档自动文摘研究[D];武汉大学;2007年
8 徐永东;多文档自动文摘关键技术研究[D];哈尔滨工业大学;2007年
9 龙华;定义问答检索关键技术研究[D];重庆大学;2010年
10 金锋;文档摘要算法的研究与应用[D];清华大学;2011年
中国硕士学位论文全文数据库 前10条
1 章芝青;基于语义的单文档自动摘要研究[D];浙江大学;2010年
2 李阜;基于滑窗取词的单文档自动摘要技术研究[D];国防科学技术大学;2010年
3 阿热帕提·尕依提;基于统计的维吾尔网页自动摘要提取研究[D];新疆大学;2011年
4 余博;基于维基百科的多文档自动摘要系统研究[D];武汉科技大学;2011年
5 商玥;面向概念查询的生物医学多文档摘要技术研究[D];大连理工大学;2011年
6 许旭阳;网络新闻多文档自动摘要技术研究[D];解放军信息工程大学;2011年
7 张文静;搜索引擎返回结果的自动摘要研究[D];中国石油大学;2010年
8 鲁凡;基于分形理论的自动摘要[D];吉林大学;2004年
9 曾红伟;摘录式单文档中文自动文摘系统的研究与实现[D];华东师范大学;2009年
10 徐绮楠;面向web文本挖掘的中文文本自动摘要关键技术研究[D];西安电子科技大学;2009年
中国重要报纸全文数据库 前8条
1 马海兵;网络舆情及其分析技术[N];光明日报;2007年
2 海量智能计算技术研究中心 霍刚;新兴技术为互联网加速[N];计算机世界;2007年
3 ;CAD大考场[N];电脑报;2004年
4 记者  周姝;Google欲火中重生?[N];上海金融报;2006年
5 本报记者 张彤;让计算机说中国话[N];网络世界;2004年
6 本报记者 张晔通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
7 ;线点科技:轻松管理互联网[N];中国计算机报;2009年
8 ;谷尼国际:精确监控网络舆情[N];中国计算机报;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978