收藏本站
《长春理工大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于Web的数据挖掘技术研究与应用

刘爽  
【摘要】:WWW无论是在访问量、大小还是在网站设计的复杂度上都以惊人的速度增长着,Web站点设计、Web服务设计和Web模式设计也都增大了难度,Web挖掘就是运用数据挖掘的思想来解决上面的各种问题。本篇论文给出了Web挖掘的体系结构,总结了Web挖掘的内容、任务、分类和Web日志挖掘的过程,在介绍了典型的数据预处理技术的基础上,实现了一种基于日志请求的参考文件的启发式会话识别算法;其次提出了改进的聚类挖掘算法,并与其他算法进行了比较,得出该算法更适用于大规模的稀疏分布的事务数据库的聚类分析;最后设计了一个Web挖掘原型系统,对模型构建做了简要的比较分析,应用聚类算法和关联规则算法对网站结构、用户访问等方面进行了分析。
【学位授予单位】:长春理工大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP311.13

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 黄雄伟;陈定方;祖巧红;;Web数据挖掘可视化研究与应用[J];湖北工业大学学报;2009年04期
中国硕士学位论文全文数据库 前3条
1 黄雄伟;基于Web数据挖掘的客户行为分析研究及应用[D];武汉理工大学;2011年
2 朱秀云;基于Web挖掘技术研究及其在数字图书馆中的应用[D];辽宁科技大学;2012年
3 马媛媛;互联网环境下的服务质量管理问题研究[D];北京工业大学;2007年
【参考文献】
中国期刊全文数据库 前10条
1 宋伟,王举成,马根峰,赵济林;Internet数据挖掘原理及实现[J];重庆邮电学院学报(自然科学版);2001年02期
2 郝先臣,张德干,高光来,赵海;数据挖掘工具和应用中的问题[J];东北大学学报;2001年02期
3 沈模卫,崔艳青,陶嵘;超文本阅览中的人的因素[J];浙江大学学报(理学版);2002年03期
4 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
5 周皓峰,朱扬勇,施伯乐;一个基于兴趣度的关联规则采掘算法[J];计算机研究与发展;2002年04期
6 李颖基,彭宏,郑启伦,曾炜;Web日志中有趣关联规则的发现[J];计算机研究与发展;2003年03期
7 吴恒山,熊波;可扩展标记语言XML的产生与应用技术[J];计算机工程与应用;2001年14期
8 邓英,李明;Web数据挖掘技术及工具研究[J];计算机工程与应用;2001年20期
9 郑秀丽,王乐宁,陈中柱;基于数据挖掘技术的电子商务客户潜力开发方案[J];计算机工程与应用;2002年05期
10 李煊,庄镇泉;Web访问挖掘预处理的用户识别算法[J];计算机工程与应用;2002年07期
【共引文献】
中国期刊全文数据库 前10条
1 钱立三;WEB日志挖掘在远程开放教育中的应用[J];安徽广播电视大学学报;2005年03期
2 钟晓旭;胡学钢;;基于数据挖掘的Web招聘信息相关性分析[J];安徽建筑工业学院学报(自然科学版);2010年04期
3 郇正军;赵国富;;基于土地利用的空间数据挖掘系统的设计与实现[J];安徽农业科学;2011年07期
4 窦祥国,胡学钢;关联规则的评价方法研究[J];安徽技术师范学院学报;2005年04期
5 叶彩虹;Web挖掘在网上购物中的应用研究[J];安庆师范学院学报(自然科学版);2004年04期
6 姚凌青;潘懋;王占刚;屈红刚;;基于COMPOSITE设计模式与XML实现变差函数模型的一致表达与存储[J];北京大学学报(自然科学版)网络版(预印本);2007年04期
7 武旭,须德;基于向量空间模型的文本自动分类系统的研究与实现[J];北方交通大学学报;2003年02期
8 孙娟;张秀梅;;浅谈数据挖掘理论与技术[J];办公自动化;2008年16期
9 姚凌青;潘懋;王占刚;屈红刚;;基于COMPOSITE设计模式与XML实现变差函数模型的一致表达与存储[J];北京大学学报(自然科学版);2008年05期
10 胡健;杨炳儒;宋泽锋;钱榕;;基于非结构化数据挖掘结构模型的Web文本聚类算法[J];北京科技大学学报;2008年02期
中国重要会议论文全文数据库 前10条
1 代广珍;徐超;;基于Web的数据挖掘研究综述[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 雷育生;甘仞初;杨军;;一种基于用户偏好的虚拟网站信息结构自适应调整算法[A];2007年全国第十一届企业信息化与工业工程学术会议论文集[C];2007年
3 ;Incremental Clustering for Categorical Data Using Clustering Ensemble[A];第二十九届中国控制会议论文集[C];2010年
4 杨晓霞;朱庆;李海峰;;知识导航的遥感信息处理服务分类选择方法[A];中国测绘学会第九次全国会员代表大会暨学会成立50周年纪念大会论文集[C];2009年
5 陈震;陈维默;;浅谈数据挖掘技术[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
6 祖巧红;陈定方;胡吉全;;分析型客户关系管理系统的研究[A];2005年十二省区市机械工程学会学术年会论文集(湖北专集)[C];2005年
7 蒋子海;周斌;吴泉源;;基于UIMA AS的文本挖掘系统的性能分析与评估[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
8 张玉连;张波;张敏;;改进的个性化信息推荐系统的设计与实现[A];2005年全国理论计算机科学学术年会论文集[C];2005年
9 曲爽;谷文祥;;基于兴趣度和负项集的关联规则挖掘算法的研究[A];2005年全国理论计算机科学学术年会论文集[C];2005年
10 周颖;;数据库中知识发现(KDD)的规则新颖性的研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
2 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
3 张结魁;消费者网络信息搜寻行为研究[D];合肥工业大学;2010年
4 李晋江;海量数据点三维重构中一类关键问题研究[D];山东大学;2010年
5 苏晓珂;基于聚类的异常挖掘算法研究[D];东华大学;2010年
6 魏小涛;在线自适应网络异常检测系统模型与相关算法研究[D];北京交通大学;2009年
7 熊回香;面向Web3.0的大众分类研究[D];华中师范大学;2011年
8 王骏;无监督学习中聚类和阈值分割新方法研究[D];南京理工大学;2011年
9 李宝红;对应分析方法及其在肿瘤学中的应用研究[D];中南大学;2011年
10 刘祾頠;分布式环境下的滑坡稳定性评价系统开发及集成技术研究[D];武汉理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 梅俊;数据挖掘中关联规则算法的研究及应用[D];安徽工程大学;2010年
2 吕晨;搜索竞价广告关键词优化问题研究[D];山东科技大学;2010年
3 齐静;数据挖掘在煤炭企业人力资源管理系统中的应用[D];山东科技大学;2010年
4 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
5 孙原;基于酉变换的权威页面挖掘算法研究[D];哈尔滨工程大学;2010年
6 丛强;基于模糊关联规则Web挖掘算法的研究[D];哈尔滨工程大学;2010年
7 孙丽萍;流形学习算法ISOMAP的改进与实现[D];大连理工大学;2010年
8 赵莲;大规模中英可比较语料库构建[D];大连理工大学;2010年
9 姜荣;时间序列的聚类和关联规则挖掘研究[D];辽宁师范大学;2010年
10 刘琼;基于群体智能的聚类算法研究[D];长沙理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 郝先臣,张德干,高光来,赵海;数据挖掘工具和应用中的问题[J];东北大学学报;2001年02期
2 曲昭伟;郑岩;吕廷杰;;基于聚类实现客户行为分析[J];东北师大学报(自然科学版);2006年02期
3 范建中;王福庆;;基于Web的数据挖掘技术研究与应用[J];电脑编程技巧与维护;2009年12期
4 王玉珍;Web数据挖掘的分析与探索[J];电脑开发与应用;2003年04期
5 潘正高;;Web数据挖掘技术综述[J];电脑知识与技术;2009年15期
6 王腾蛟;林子雨;;数据挖掘在电信领域客户行为分析中的应用[J];电信技术;2008年01期
7 王凌峰;;用电子商务来发展中国钢铁物流[J];电子商务;2009年01期
8 钟杨俊;文堂柳;;可视化数据挖掘方法与技术[J];福建电脑;2008年08期
9 蒋红兰;;寻找解决中国钢铁物流高成本的对策——物流信息化[J];经营管理者;2009年21期
10 黄雄伟;陈定方;祖巧红;;Web数据挖掘可视化研究与应用[J];湖北工业大学学报;2009年04期
中国硕士学位论文全文数据库 前10条
1 张育智;网络时代的顾客关系管理[D];厦门大学;2001年
2 李幸;基于差距理论和ISO9001标准的航空客运服务质量管理[D];四川大学;2003年
3 孙钢;基于.NET平台的服务质量管理研究[D];广西大学;2004年
4 雷瑛;基于J2EE规范的数字图书馆互操作的实现[D];武汉大学;2004年
5 熊拥军;数据挖掘在数字图书馆个性化服务中的应用[D];中南大学;2005年
6 孙文;个性化数字图书馆的研究与开发[D];西安电子科技大学;2005年
7 黄婷;饭店服务接触互动质量控制研究[D];浙江大学;2006年
8 许乐平;基于数据挖掘技术的客户关系管理系统研究[D];合肥工业大学;2007年
9 史真真;数据挖掘在客户关系管理中的研究及应用[D];长春理工大学;2008年
10 冯璐;基于数据挖掘的供电公司客户关系管理系统研究与开发[D];华北电力大学(北京);2008年
【二级引证文献】
中国期刊全文数据库 前2条
1 许彦如;王长波;刘玉华;章群燕;;多维网络论坛数据的层次可视化[J];计算机科学;2011年02期
2 于德水;;互联网与服务质量保证[J];中国新技术新产品;2011年07期
中国硕士学位论文全文数据库 前2条
1 兰琦;B2C电子商务服务质量评价影响因素研究[D];电子科技大学;2010年
2 黄雄伟;基于Web数据挖掘的客户行为分析研究及应用[D];武汉理工大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 孙健,王伟,钟义信;基于K-最近距离的自动文本分类的研究[J];北京邮电大学学报;2001年01期
2 冯成志,沈模卫;视线跟踪技术及其在人机交互中的应用[J];浙江大学学报(理学版);2002年02期
3 张国煊,王小华,周必水;快速书面汉语自动分词系统及其算法设计[J];计算机研究与发展;1993年01期
4 汪晓岩,胡庆生,李斌,庄镇泉;面向Internet的个性化智能信息检索[J];计算机研究与发展;1999年09期
5 王继成,邹涛,杨小江,潘金贵,张福炎;基于Internet的信息资源发现技术与实现[J];计算机研究与发展;1999年11期
6 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
7 周欣,沙朝锋,朱扬勇,施伯乐;兴趣度——关联规则的又一个阈值[J];计算机研究与发展;2000年05期
8 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期
9 周斌,吴泉源,高洪奎;用户访问模式数据挖掘的模型与算法研究[J];计算机研究与发展;1999年07期
10 楼伟进,孔繁胜,楼伟忠;数据仓库与知识发现[J];计算机工程与应用;2000年10期
【相似文献】
中国期刊全文数据库 前10条
1 熊忠阳;周亚峰;;Web访问挖掘的预处理技术的研究[J];计算机技术与发展;2007年08期
2 李翠霞;谭莹军;;关于Web日志挖掘的研究[J];安阳工学院学报;2007年01期
3 王岚,张鹏祥;基于Web的数据挖掘研究[J];长春师范学院学报;2005年07期
4 郭运宏;;数据挖掘、Web挖掘与Web日志挖掘之研究[J];郑州铁路职业技术学院学报;2006年02期
5 孔祥洪,翁梅;基于Web的数据挖掘分类技术[J];中国科技信息;2005年20期
6 龚月瑛;;Web信息挖掘现状及应用前景[J];科技情报开发与经济;2007年20期
7 姚洪波;杨炳儒;;Web日志挖掘数据预处理过程技术研究[J];微计算机信息;2006年18期
8 吕亚丽;;WEB日志挖掘及其应用研究[J];山西财经大学学报;2006年S1期
9 吕佳;;基于免疫聚类的Web日志挖掘[J];重庆师范大学学报(自然科学版);2007年02期
10 李淑杰;;Web日志挖掘预处理方案的几点思考[J];黑龙江科技信息;2009年36期
中国重要会议论文全文数据库 前10条
1 李忍;孙晶;刘令君;;一个体育比赛技战术分析数据挖掘工具的设计与实现[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
2 常智荣;马自卫;邓芳;;基于Web日志的数据挖掘技术的研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
3 杨春梅;万柏坤;丁北生;;数据预处理和初始化方法对K-均值聚类的影响[A];中国仪器仪表学会第五届青年学术会议论文集[C];2003年
4 胡钛;李英玉;孟新;王春梅;李秀冰;;双星计划地面应用数据预处理的设计与实现[A];中国空间科学学会空间探测专业委员会第十七次学术会议论文集[C];2004年
5 谭立云;凯丽比努尔;塔西甫拉提;高学东;热合木江;;数据挖掘中的数据预处理方法研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
6 吕琳;朱东华;刘玉琴;;面向数据仓库的数据预处理研究综述[A];2007年中国智能自动化会议论文集[C];2007年
7 周炳玉;卢野;刘珍阳;;多传感器数据融合中的数据预处理技术研究[A];2007年光电探测与制导技术的发展与应用研讨会论文集[C];2007年
8 忻雅;王伟科;阮松林;王世恒;马华升;;基于RAPD和EST-SSR标记的秀珍菇菌株聚类分析[A];中国菌物学会第四届会员代表大会暨全国第七届菌物学学术讨论会论文集[C];2008年
9 鲁振华;宋银花;牛良;刘淑娥;王志强;;PermutMatrix软件及其在观赏桃形态性状聚类分析中的应用[A];中国园艺学会桃分会第二届学术年会论文集[C];2009年
10 傅琪琦;乐嘉锦;;CRM数据仓库中的数据预处理研究[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
中国重要报纸全文数据库 前10条
1 刘庆;关于数据挖掘工具的讨论[N];网络世界;2006年
2 汪雯;如何进行数据挖掘[N];金融时报;2006年
3 袁闻;数据挖掘和在线分析处理[N];金融时报;2006年
4 记者  王璐;数据挖掘 提升银行核心竞争力[N];金融时报;2006年
5 张少荣;除了技术 还需要什么[N];金融时报;2006年
6 陈金波;数据挖掘:提升电信CRM水平的助推器[N];人民邮电;2007年
7 梅静彦;数据挖掘技术在美国银行的应用[N];金融时报;2006年
8 ;聚类分析在自身免疫病基因表达谱研究中的初步应用[N];中国医药报;2003年
9 高芸;数据挖掘技术:整合数据库信息的利器[N];中国城乡金融报;2005年
10 NCR(中国)有限公司数据仓库事业部 张新宇;开放标准提升数据挖掘效率[N];通信产业报;2006年
中国博士学位论文全文数据库 前10条
1 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
2 肖敏;基于领域本体的电子商务推荐技术研究[D];武汉理工大学;2009年
3 赵宁;理中丸和四君子汤与脾虚证方证相关性的实验研究[D];中国中医科学院;2006年
4 曹锋;数据流聚类分析算法[D];复旦大学;2006年
5 吕崇山;代谢综合征中医辨证分型及其与临床检测指标的相关性研究[D];福建中医学院;2008年
6 袁军宝;我国农业现代化进程中的农户兼业经营问题研究[D];兰州大学;2009年
7 邵伟钰;地方政府债务风险预警体系研究[D];苏州大学;2008年
8 吴飞珍;基因芯片数据的聚类功能评价算法和判别分析算法研究[D];上海大学;2009年
9 易明;基于Web挖掘的电子商务个性化推荐机理与方法研究[D];华中科技大学;2006年
10 鲍钰;WEB日志挖掘及其应用研究[D];华东师范大学;2010年
中国硕士学位论文全文数据库 前10条
1 王峰;数据挖掘在证券公司客户关系管理中的应用[D];哈尔滨工程大学;2008年
2 李政博;一种适用于领域专家的WEB数据提取的方法[D];吉林大学;2009年
3 石义芳;数据挖掘技术在病人流量分析中的应用研究[D];暨南大学;2006年
4 刘爽;基于Web的数据挖掘技术研究与应用[D];长春理工大学;2007年
5 刘进;数据挖掘在学生信息管理系统中的应用[D];重庆大学;2008年
6 张峰;基于原料蔗糖份数据挖掘的应用研究[D];南京工业大学;2005年
7 张姝;网站可用性分析及可视化技术研究[D];沈阳工业大学;2006年
8 王平;统计方法在客户细分数据挖掘中的应用[D];华东师范大学;2009年
9 管进勇;数据挖掘在银行个人优质客户管理中的应用研究[D];南昌大学;2008年
10 冯瑶;基于零售业的数据挖掘技术和关联规则算法的改进研究[D];河北工业大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026