收藏本站
《武汉科技大学》 2004年 硕士论文
收藏 | 手机打开
二维码
手机客户端打开本文

Web文本挖掘研究与实现

易高翔  
【摘要】:web网络上凝聚了人类无穷的智慧,但由于它数据的无结构化和无索引特点,使我们充分利用这丰富的信息变得越来越困难了,但是,我们对信息的检索速度和准确性却要求越来越高。面对这一矛盾,以人工智能为基础的数据挖掘技术,如关联规则挖掘、分类、聚类迅速发展,给这一问题解决带来了希望。Web挖掘的概念应运而生。本文主要研究web文本挖掘技术。 首先,文章介绍了web文本挖掘的重要意义。应用文本挖掘可以更好地组织搜索引擎的返回结果,可以进一步提高信息检索速度。 接着,介绍了web挖掘的背景知识—数据挖掘的概念、发展历史、应用领域和主要方法。分析指出未来数据挖掘方向是Web挖掘。Web挖掘根据挖掘的数据可以分为web内容挖掘、web结构挖掘和web使用挖掘。Web文本挖掘是web内容挖掘的一部分。 介绍了web挖掘相关知识后,文章重点讨论了web文本挖掘技术。详细阐述了web文本分类技术、web文本聚类技术和关联规则挖掘技术。同时,在研究web文本挖掘技术基础上,设计了web文本挖掘框架,并实现了web页面自动下载、web页面自动分类功能模块,应用实验数据,运行效果良好。 最后,对文章进行了总结,提出了作者对未来工作的建议。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张宏松;刘建辉;;面向Web的文本信息挖掘研究[J];计算机系统应用;2006年09期
2 赵晓静;;Web文本挖掘综述[J];电脑学习;2008年05期
3 李颖,阎保平;Web文本挖掘在互联网信息统计中的研究与设计[J];微电子学与计算机;2005年01期
4 石福斌;;一种基于多Agent技术的Web挖掘模型及应用[J];信息技术;2007年06期
5 杨小云;数字图书馆中数据挖掘研究[J];延安教育学院学报;2005年02期
6 王圆;孙铁利;李杨;;Web文本挖掘中的特征表示和特征提取[J];电脑知识与技术(学术交流);2006年14期
7 黄鲁成;赵盼;;关于采用Web挖掘方法分析技术发展趋势的思考[J];科技管理研究;2010年21期
8 张燕;寒枫;楚红涛;;文本挖掘简述[J];中国电力教育;2006年S3期
9 邓英,李明;Web数据挖掘技术及工具研究[J];计算机工程与应用;2001年20期
10 王艳;数据挖掘在数字图书馆中的应用[J];现代图书情报技术;2002年05期
11 张涛;邓军;;现代远程教育个性化Web挖掘研究[J];科学技术与工程;2007年05期
12 史嘉陵;;数据挖掘在数字图书馆个性化服务中的应用[J];农业网络信息;2009年04期
13 王艳;数据挖掘在数字图书馆中的应用[J];情报科学;2003年02期
14 刘彦保;王文发;王文东;;基于聚类分析策略的Web文本挖掘方法[J];延安大学学报(自然科学版);2007年04期
15 朱东华;荆雷;徐建国;;计算机前沿技术在科技管理领域的应用研究[J];科技进步与对策;2003年09期
16 崔志明,谢春丽;基于Web的文本挖掘研究[J];微电子学与计算机;2002年10期
17 谢秋华;;Web文本挖掘的相关技术问题探讨[J];长春理工大学学报;2010年07期
18 赵卫军;;数据挖掘技术在高校图书馆中的应用[J];图书馆论坛;2007年04期
19 黄迎春;李晓晔;邓文新;;文本挖掘技术的研究[J];齐齐哈尔大学学报;2006年03期
20 胡冰;胡东军;马文超;;文本挖掘研究及发展[J];电脑知识与技术;2008年31期
中国重要会议论文全文数据库 前10条
1 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
3 刘秉权;李博;孙林;王宝勋;刘远超;;标签特征和正文特征融合的SVM博客文本分类算法研究[A];第六届全国信息检索学术会议论文集[C];2010年
4 杜志文;曾文华;;网格计算在文本分类中的应用[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
5 王继成;孙颖;张福炎;;文本挖掘-数据挖掘研究的新课题[A];第十六届全国数据库学术会议论文集[C];1999年
6 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 商炳章;白清源;;基于特征项权重改进的关联文本分类[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
8 胡俊;黄厚宽;;一种基于SVM的可视化文本分类的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
9 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
10 朱慕华;陈文亮;朱靖波;;词聚类在文本分类中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
2 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
3 文翰;面向信息检索的Web文本挖掘方法研究[D];华南理工大学;2012年
4 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
5 檀敬东;文本挖掘的若干关键算法研究[D];中国科学技术大学;2010年
6 王占一;Web文本挖掘中若干问题的研究[D];北京邮电大学;2012年
7 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
8 李彦鹏;特征耦合泛化及其在文体挖掘中的应用[D];大连理工大学;2011年
9 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
10 易明;基于Web挖掘的电子商务个性化推荐机理与方法研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 易高翔;Web文本挖掘研究与实现[D];武汉科技大学;2004年
2 徐华;基于支持向量机的Web文本挖掘研究[D];哈尔滨工程大学;2004年
3 崔鹏;一种基于支持向量机的直推式WEB挖掘[D];大连海事大学;2006年
4 刘岩;基于Web的文本挖掘技术的研究[D];哈尔滨工程大学;2004年
5 谢振亮;基于WEB挖掘技术的网页自动分类和聚类的研究[D];天津大学;2004年
6 程春惠;公安犯罪案件文本挖掘关键技术研究[D];浙江大学;2010年
7 徐爱华;面向文本分类的中文文本挖掘技术研究及实现[D];武汉理工大学;2004年
8 刘静;基于Web文本挖掘的SVM网页文本分类研究[D];东北财经大学;2006年
9 李凯;Web挖掘在教学资源搜索引擎中的应用研究[D];东北师范大学;2007年
10 王会芬;基于Web的网页聚类系统的研究与实现[D];天津大学;2005年
中国重要报纸全文数据库 前10条
1 本报记者 施鹏;非结构信息和文本挖掘[N];21世纪经济报道;2009年
2 周青 编译;文本挖掘工具实现非结构化数据价值[N];计算机世界;2004年
3 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
4 ;SAS公司收购Teragram 强化BI领域地位[N];计算机世界;2008年
5 本报记者 张晶;怎样挖掘专家的活的经验和智慧[N];科技日报;2011年
6 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
7 汪洋 编译;BI平民化[N];计算机世界;2004年
8 靳辉;垂直搜索:呼叫经济发展的核心动力[N];通信产业报;2007年
9 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
10 ;Web收获:吸纳有用信息[N];计算机世界;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978