收藏本站
《大庆石油学院》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

Web数据的挖掘方法研究

孙丽  
【摘要】: 数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。数据挖掘(Data Mining),是指从大型数据库或数据仓库中提取隐含的、未知的及有潜在应用价值的信息或模式。它是数据库研究中的一个很有应用价值的新领域,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。Web挖掘为人工智能领域中数据挖掘技术的一个热点,它实现对Web存取模式、Web结构和规则,以及动态的Web内容的查找功能,是一个更具挑战性的课题。本文研究的主要内容是Web内容(文本)挖掘。 文中首先对数据挖掘及Web挖掘技术进行了概述,对Web数据的特点作了分析和研究,比较了XML与传统数据库的区别,然后选择XML文档来保存数据。其次,根据Web挖掘的任务,给出了本课题的实现方法:神经网络与Boosting算法相结合进行文本分类。本课题的实现方法与单纯基于神经网络的方法相比,在样本的识别率和分类的准确率上都有所提高。 目前,该系统已经能试验性运行,效果良好,达到了预期的学习和实践的目的,为进一步研究Web挖掘奠定了基础。
【学位授予单位】:大庆石油学院
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:TP311.13

【相似文献】
中国期刊全文数据库 前10条
1 滕启龙;王健;;基于Web挖掘的个性化远程教学系统的研究与实现[J];福建电脑;2011年06期
2 王立平;刘艳玲;;web挖掘在农业数字图书馆中的应用[J];农业考古;2011年03期
3 曹宇;尹刚;李翔;程荣斌;王怀民;;聚类搜索引擎研究进展浅析[J];电脑知识与技术;2011年22期
4 刘秀敏;刘秀娟;王国明;周立波;;基于Web挖掘的个性化教学推荐系统[J];计算机时代;2011年07期
5 曹棣;孔晓斌;;基于粗糙k-均值的web事务的聚类[J];山西师范大学学报(自然科学版);2011年02期
6 夏惠芬;董卫民;;基于关联规则的Web挖掘技术研究[J];现代电子技术;2011年16期
7 陈懿炜;姚争为;杨超越;;基于粗糙集的个性化学习平台的研究[J];微计算机应用;2011年05期
8 马伟杰;;数据挖掘在高校学生工作中的应用[J];软件导刊;2011年08期
9 戴菲;;数据挖掘技术在电子商务中的应用[J];电脑知识与技术;2011年21期
10 张笑;;一种新的基于Web日志的数据聚类算法研究[J];电脑知识与技术;2011年21期
中国重要会议论文全文数据库 前10条
1 易虹;许德刚;;Web数据挖掘的研究与应用[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
2 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
3 董燕;;Web挖掘对电子商务网站建设的影响[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
4 师伟;廖闻剑;;数据挖掘在Web上的研究与应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
5 张艳;周国祥;;Web挖掘在个性化信息检索中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
6 吴珊;杨桦;;基于日志挖掘的Web预取模型[A];2006年电气工程教育专业委员会年会论文集[C];2006年
7 习慧丹;;Web日志挖掘探析[A];第三届全国软件测试会议与移动计算、栅格、智能化高级论坛论文集[C];2009年
8 宋江春;沈钧毅;;基于CORBA的分布式Web挖掘系统的设计与实现[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
9 王磊;王丰辉;郑康锋;杨义先;;基于Web挖掘技术的漏洞收集系统研究与设计[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
10 林政;吕雅娟;刘群;马希荣;;基于双语混和网页的平行语料挖掘[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国重要报纸全文数据库 前10条
1 土钵 编译;WebFountain赋予Web数据意义[N];计算机世界;2004年
2 武汉 杨颖;Excel2000的Web数据发布功能[N];中国计算机报;2000年
3 ;Web数据流分析超越点击计数[N];网络世界;2000年
4 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
5 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
6 ;Web收获:吸纳有用信息[N];计算机世界;2004年
7 ;快速开发平台(JH.NET)[N];计算机世界;2001年
8 四川大学计算机学院 陈华英;组建基于 Web 方式的数据仓库[N];网络世界;2000年
9 周娴;三国结盟,能否迎来Linux盛世[N];中国电子报;2005年
10 ;感受“酷”的力量[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
2 肖敏;基于领域本体的电子商务推荐技术研究[D];武汉理工大学;2009年
3 易明;基于Web挖掘的电子商务个性化推荐机理与方法研究[D];华中科技大学;2006年
4 阮备军;Web使用挖掘若干关键问题研究[D];复旦大学;2004年
5 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
6 李君轶;基于Internet的陕西国内旅游市场虚拟研究[D];陕西师范大学;2007年
7 何丽;基于Web挖掘的决策支持系统模型研究[D];天津大学;2005年
8 易高翔;粗糙集在Web挖掘中的应用研究[D];华中科技大学;2006年
9 徐振宁;基于本体的Web数据语义信息的表示与处理方法研究[D];中国人民解放军国防科学技术大学;2002年
10 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
中国硕士学位论文全文数据库 前10条
1 孙丽;Web数据的挖掘方法研究[D];大庆石油学院;2004年
2 蒲秋梅;基于XML的Web数据挖掘技术的研究[D];武汉大学;2004年
3 陈耀光;Web数据查询研究[D];江西财经大学;2002年
4 谢振亮;基于WEB挖掘技术的网页自动分类和聚类的研究[D];天津大学;2004年
5 黄荣兵;RBF神经网络在Web挖掘中的应用研究[D];太原理工大学;2004年
6 易高翔;Web文本挖掘研究与实现[D];武汉科技大学;2004年
7 马征;基于本体的Web页面分类挖掘[D];中南大学;2004年
8 张承明;基于Web的数据挖掘研究[D];山东科技大学;2003年
9 段晓峰;网站日志的数据挖掘[D];重庆大学;2003年
10 牟刚;基于XML的Web信息挖掘技术的研究[D];重庆大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026