收藏本站
《河海大学》 2001年
收藏 | 手机打开
二维码
手机客户端打开本文

Web挖掘技术

李晓  
【摘要】: 计算机应用的广泛深入发展,使得人类收集到的信息“爆炸性”的增长。 传统的数据库和OLTP技术提供了数据操作性的支持,却不支持对数据的深层次 的处理。数据仓库和OLAP技术的发展,在一定程度上缓解了这个矛盾。而如 何利用现有的计算能力和人类已有知识发现隐藏在信息“海洋”深处的知识,是 人类认知专家、计算机专家、心理学家等所面临的最大挑战。伴随计算能力的增 长,智能算法的成熟及大规模数据存储技术的成熟,作为自动发现知识的工具, 数据挖掘(Data Ming)逐渐走出实验室,进入生产领域并发挥了积极的作用。 20世纪90年代以来,Internet得到了的飞速发展,成为人们工作与学习的 平台。WWW作为最大的信息集散地,更是积聚了海量的信息。网络由此被认为 是人类史上的第四次工业革命。如何从数以亿计的页面中发现需要的内容,如何 从大量的访问中发现固有的模式和关联,成了人们迫切希望解决的问题。Web 挖掘,源于数据挖掘和Internet技术的结合,研究网上内容自动分类,智能Agent, 用户访问模式发现,成了计算机工作者研究的新热点。 本文首先介绍了数据挖掘的一些基本概念、方法和技术、工具。阐明了什么 是数据挖掘、为什么要数据挖掘、如何进行数据挖掘、数据挖掘的主要过程、分 类及数据挖掘与OLAP(在线分析过程)等的联系等,并介绍了有关数据挖掘发 展情况。 然后,本文着重论述了Web挖掘的内容,任务,它与数据挖掘的联系与区 别,并介绍了使用模式挖掘及其技术。在研究基础上,本文提出了一个数据仓库 和Web挖掘结合的模型,并就此进行了实验。 本文最后总结了工作尚存的不足,并指出了Web挖掘研究的方向、应用前 景和它所面临的挑战。
【学位授予单位】:河海大学
【学位级别】:硕士
【学位授予年份】:2001
【分类号】:TP311.135

【引证文献】
中国期刊全文数据库 前1条
1 宁建飞;;一种基于Web日志的Web用户群体和URL聚类算法[J];海南大学学报(自然科学版);2012年04期
中国博士学位论文全文数据库 前1条
1 荣耀;海底隧道衬砌裂缝控制关键技术研究[D];同济大学;2007年
中国硕士学位论文全文数据库 前2条
1 葛昕;数据挖掘在Web使用模式中的研究和应用[D];广西大学;2003年
2 曲义飞;基于Web使用挖掘的用户消费模式发现研究[D];大连理工大学;2006年
【参考文献】
中国期刊全文数据库 前10条
1 周欣,沙朝锋,朱扬勇,施伯乐;兴趣度——关联规则的又一个阈值[J];计算机研究与发展;2000年05期
2 朱明,林世隆,王俊普;一种聚类型基于示例学习新方法[J];计算机研究与发展;2000年11期
3 李蕾,王楠,张剑,钟义信,郭祥昊,贾自燕;中文搜索引擎概念检索初探[J];计算机工程与应用;2000年06期
4 解冲锋,李星;并行式Meta Search系统的设计与实现[J];计算机工程与应用;1999年02期
5 陆伟;吴朝晖;;知识发现方法的比较研究[J];计算机科学;2000年03期
6 王实;高文;李锦涛;;Web数据挖掘[J];计算机科学;2000年04期
7 黄益民;;经常性周期关联规则的研究[J];计算机科学;2000年04期
8 刘明吉;王秀峰;黄亚楼;;数据挖掘中的数据预处理[J];计算机科学;2000年04期
9 刁倩,张惠惠,王永成;Internet上的英文搜索引擎[J];计算机工程;1999年07期
10 邓伟,张志伟,谭庆平,宁洪;一种新型的智能搜索引擎[J];计算机工程;2000年03期
【共引文献】
中国期刊全文数据库 前10条
1 窦祥国,胡学钢;关联规则的评价方法研究[J];安徽技术师范学院学报;2005年04期
2 王岚,张鹏祥;基于Web的数据挖掘研究[J];长春师范学院学报;2005年07期
3 王恩德,刘国斌;基于经济景气分析数据仓库的设计与实现[J];吉林大学学报(信息科学版);2005年04期
4 刘培云;贾兴林;杜鸿明;张艳;杨晋浩;;交叉表在市场调查中的应用[J];成都大学学报(自然科学版);2010年04期
5 唐培丽;解飞;陈志雨;;基于概念检索的中文搜索引擎研究[J];长春大学学报;2006年04期
6 夏葵;基于数据挖掘的三层入侵检测模型研究及应用[J];重庆职业技术学院学报;2005年02期
7 刘翌南;基于SPI的信息过滤的设计及实现[J];长沙交通学院学报;2005年01期
8 卢咏;卢云;;基于WEB日志挖掘的旅游信息资源网站个性化研究[J];长沙铁道学院学报(社会科学版);2007年04期
9 林华;;现代医院病案统计分析存在的问题与对策[J];当代经济;2009年24期
10 杨明;;水文信息共享的应用研究[J];东北水利水电;2009年11期
中国重要会议论文全文数据库 前10条
1 王皓;曹永锋;孙洪;;基于流域变换的聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
2 曲爽;谷文祥;;基于兴趣度和负项集的关联规则挖掘算法的研究[A];2005年全国理论计算机科学学术年会论文集[C];2005年
3 周颖;;数据库中知识发现(KDD)的规则新颖性的研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
4 刘晨;周惠民;;基于空间数据仓库的气象信息共享的应用研究[A];数据库技术在气象领域的应用学术会议论文集[C];2001年
5 陈文亮;朱靖波;姚天顺;张宇新;;基于Bootstrapping的领域词汇自动获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 孙丽华;肖诗斌;施水才;;基于向量空间模型的规则分类技术[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
8 李通;刘昌钰;唐常杰;左劼;于中华;;基于自然语言理解技术的Web文件分类与过滤[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
9 彭玉青;何华;顾军华;;基于粗集理论的归纳依赖关系的研究[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
10 周皓峰;阮备军;朱建秋;朱扬勇;施伯乐;;ARMiner:一个基于关联规则的数据采掘工具[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
中国博士学位论文全文数据库 前10条
1 沈巍;建立股指波动预测模型的方法研究及应用[D];华北电力大学(北京);2011年
2 赵楠;基于机器学习的供应链绩效智能分析方法研究[D];天津大学;2010年
3 黄水清;非相关文献知识发现方法及在农业经济学中的应用[D];南京农业大学;2010年
4 张智雄;Internet科技信息资源门户网站(STIP)系统的实践研究[D];中国科学院文献情报中心;2000年
5 关志伟;面向用户意图的智能人机交互[D];中国科学院软件研究所;2001年
6 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
7 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
8 朱建生;基于知识管理的现代办公信息系统的研究[D];铁道部科学研究院;2002年
9 周皓峰;关联规则挖掘的拓展性研究[D];复旦大学;2003年
10 苏健;基于粗糙集的数据挖掘与决策支持方法研究[D];浙江大学;2002年
中国硕士学位论文全文数据库 前10条
1 韩微微;基于web日志的网络课程使用状况信息采集及评价的研究[D];哈尔滨师范大学;2010年
2 孙原;基于酉变换的权威页面挖掘算法研究[D];哈尔滨工程大学;2010年
3 高龙;天津港数据集成平台关键技术应用研究[D];大连海事大学;2010年
4 黄学辉;数据挖掘分类技术在企业人才招聘中的应用研究[D];中国海洋大学;2010年
5 陈凤萍;寿光人才求职招聘网站中资源检索算法的研究[D];中国海洋大学;2010年
6 周登;基于N-Gram模型的藏文文本分类技术研究[D];西北民族大学;2010年
7 周绪倩;基于电子商务的Web数据挖掘系统架构研究[D];河北工程大学;2010年
8 赵荣华;码头堆场预测算法的研究和应用[D];华南理工大学;2010年
9 高新;银行客户信息数据仓库的实现与应用[D];华南理工大学;2010年
10 费洪刚;个性化网站的研究与应用[D];长春工业大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 沙桂英,杨丽颖,姜风春,刘瑞堂;应力波载荷作用下弹塑性断裂全过程的动态分析[J];兵工学报;2003年03期
2 卢文波,赖世骧,董振华;岩石钻爆开挖中预裂缝的隔震效果分析[J];爆炸与冲击;1997年03期
3 孙道恒,孙训方,刘先斌;低周疲劳表面裂纹演化进程分析[J];材料科学与工程;2000年04期
4 龚尚龙;水泥胶微观结构量测方法的研究[J];重庆交通学院学报;1994年02期
5 郝先臣,刘小玲,周建华,赵海;模糊聚类挖掘方法在电子商务中的应用[J];东北大学学报;2001年04期
6 黄明利,唐春安,梁正召;岩石裂纹相互作用的应力场分析[J];东北大学学报;2001年04期
7 张小萍,张伟东;混凝土材料性能对其裂缝影响试验研究[J];东莞理工学院学报;2003年02期
8 刘大刚,李志华;大风风力预报准确率的统计特征分析[J];大连海事大学学报;2003年04期
9 何卫东,李力行,关天民,孙志礼,赵乃素,何德芳;摆线针轮减速机的逻辑诊断与故障树分析[J];大连铁道学院学报;1994年02期
10 宋爱波,胡孔法,董逸生;Web日志挖掘[J];东南大学学报(自然科学版);2002年01期
中国博士学位论文全文数据库 前1条
1 李雪红;重大水工混凝土结构裂缝演变规律及转异诊断方法研究[D];河海大学;2003年
中国硕士学位论文全文数据库 前4条
1 段练军;数据挖掘在WWW上的实现技术[D];郑州大学;2001年
2 苏毅娟;数据挖掘中若干问题的研究[D];广西师范大学;2001年
3 方孝伍;水工涵闸工程混凝土裂缝成因与抗裂技术研究[D];河海大学;2004年
4 孙英慧;基于向量空间模型的数据挖掘技术的研究[D];东北师范大学;2005年
【二级引证文献】
中国期刊全文数据库 前3条
1 韩建伟;;浅谈公路隧道工程[J];黑龙江科技信息;2010年32期
2 荣耀;黄红元;姜安龙;;过江输水管单层管片结构裂缝参数计算分析[J];南昌航空大学学报(自然科学版);2008年02期
3 王亮;孙昱;;图书电子商务中的客户信息挖掘[J];科技与出版;2012年10期
中国重要会议论文全文数据库 前1条
1 张士兵;王练柱;;隧道衬砌裂缝成因分析与检测[A];西部矿山建设工程理论与实践[C];2009年
中国博士学位论文全文数据库 前1条
1 郁雪;基于协同过滤技术的推荐方法研究[D];天津大学;2009年
中国硕士学位论文全文数据库 前8条
1 钮晶莹;企业年金数据立方体的设计与实现[D];电子科技大学;2010年
2 林伟强;基于web挖掘的电子商务推荐系统的实现与研究[D];电子科技大学;2011年
3 樊玫;基于kohonen神经网络的用户访问模式挖掘模型的研究[D];南昌大学;2007年
4 吉艳雷;厦门东通道海底隧道二次衬砌安全性及锈蚀行为研究[D];西南交通大学;2008年
5 马晓艳;基于用户浏览路径的Web用户聚类研究[D];西南大学;2009年
6 信春雷;不同防排水模式对山岭隧道衬砌水压力影响关系研究[D];西南交通大学;2011年
7 陈东柱;高速铁路隧道衬砌裂缝病害及其整治措施研究[D];中南大学;2012年
8 郑伟;模糊BP神经网络Web用户分类算法研究[D];浙江工业大学;2012年
【二级参考文献】
中国期刊全文数据库 前5条
1 王珏;Rough Set约简与数据浓缩[J];高技术通讯;1997年11期
2 周会平;王挺;史晓东;陈火旺;齐璇;;一个基于中间语言的汉英机器翻译系统[J];计算机科学;1998年05期
3 张潮生;语义表达的一些性质[J];中文信息学报;1991年01期
4 曾民族;网络信息检索现状和性能评价[J];情报学报;1997年02期
5 章琳,张保明;WWW检索工具比较研究[J];情报学报;1998年04期
【相似文献】
中国期刊全文数据库 前10条
1 余华鸿;;电子商务中Web挖掘技术的应用[J];今日科苑;2008年18期
2 石岩;;Web挖掘技术在电子商务中的应用[J];科技情报开发与经济;2006年23期
3 宋艳;刘少华;;Web挖掘在电子商务中的应用[J];电脑知识与技术;2008年14期
4 史哲;;基于XML的Web数据挖掘及应用模式研究[J];科技创新导报;2011年02期
5 秦鸿;基于Web的数据挖掘[J];电子科技大学学报;2002年S1期
6 刘峰,张文鹏;远程教学系统中的关键技术——Web挖掘[J];南阳师范学院学报;2005年09期
7 李泽文;基于Web的数据挖掘技术[J];现代计算机;2004年07期
8 陈伟;;Web挖掘在电子商务中的应用研究[J];商场现代化;2009年02期
9 于海涛;;Web挖掘技术在搜索引擎中的应用[J];齐齐哈尔师范高等专科学校学报;2009年06期
10 柳珺;;Web挖掘技术与电子商务[J];商场现代化;2007年09期
中国重要会议论文全文数据库 前10条
1 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
2 易虹;许德刚;;Web数据挖掘的研究与应用[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
3 吴珊;杨桦;;基于日志挖掘的Web预取模型[A];2006年电气工程教育专业委员会年会论文集[C];2006年
4 刘建国;;关联规则采掘的研究[A];2001年中国智能自动化会议论文集(下册)[C];2001年
5 曹波伟;薛青;郑长伟;于屏岗;陈辰;;基于数据挖掘的装备维修管理智能分析模型研究[A];'2010系统仿真技术及其应用学术会议论文集[C];2010年
6 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
7 蔡晟;吕中楠;邓欢军;;基于数据挖掘和OLAP的铝电解槽数据录入与分析系统的设计[A];中国计量协会冶金分会2008年会论文集[C];2008年
8 蔡晟;吕中楠;邓欢军;;基于数据挖掘和OLAP的铝电解槽数据录入与分析系统的设计[A];2008全国第十三届自动化应用技术学术交流会论文集[C];2008年
9 王晨;韩览山;薛四新;邵贝恩;;基于多维数据仓库的集团化企业总部EIS[A];第二十届中国控制会议论文集(下)[C];2001年
10 周国栋;杨爱萍;;宝钢股份不锈钢分公司企业级数据仓库系统架构[A];全国炼钢连铸过程自动化技术交流会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
2 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
2 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
3 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
4 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
5 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
6 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
7 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
8 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
9 何丽;基于Web挖掘的决策支持系统模型研究[D];天津大学;2005年
10 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 蒲秋梅;基于XML的Web数据挖掘技术的研究[D];武汉大学;2004年
2 张承明;基于Web的数据挖掘研究[D];山东科技大学;2003年
3 郭鹏;基于Web数据挖掘分类算法的个性化信息服务[D];太原理工大学;2003年
4 陈敏;基于Web使用挖掘的知识发现研究[D];合肥工业大学;2005年
5 祝效普;WEB用户访问序列模式挖掘[D];天津大学;2005年
6 孙丽;Web数据的挖掘方法研究[D];大庆石油学院;2004年
7 冶红;基于数据挖掘的Web挖掘系统的研究[D];大连理工大学;2003年
8 段晓峰;网站日志的数据挖掘[D];重庆大学;2003年
9 彭希鸿;基于Web内容挖掘的网页分类与过滤研究与应用[D];中南大学;2003年
10 潘延军;基于用户浏览内容的Web用户浏览行为个性化研究[D];天津大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026