收藏本站
《复旦大学》 2004年 博士论文
收藏 | 手机打开
二维码
手机客户端打开本文

Web使用挖掘若干关键问题研究

阮备军  
【摘要】:Web使用挖掘(Web Usage Mining)是应用数据挖掘技术从Web数据中发现使用模式的过程。Web提供了一种不受时空限制的人机交互界面,为大规模记录,收集,分析和抽取用户行为信息提供了巨大的技术发展空间。在此背景下,Web使用挖掘研究得到了学术界和工业界的广泛关注,由此衍生的技术大量应用在科学研究,软件设计以及商业智能等领域。 本文总结了目前Web使用挖掘研究的现状,对其中存在的一些问题作了深入的研究和探讨。这些问题分别涉及频繁序列模式挖掘,Web用户行为特征相似性/差别的量化方法,以及支持Web站点设计优化的数据挖掘技术。 本文的主要贡献如下: (1)提出了一个称为TD-WAP-Mine的频繁序列模式挖掘算法。和已有的算法相比,它采用了新的频繁模式搜索策略,大幅度减少了在构造中间数据方面的工作量。大量的实验结果表明此算法在运行速度方面好于原有的算法,特别适合用在需要挖掘大量频繁模式的场合。 (2)提出了一种使用Web结构数据所蕴涵的语义信息量化使用行为特征差别的方法。与已有的研究相比,特征项之间的关系表示结构从有向根树扩展到了有向无环图。基于核心概念“最大相似宽度”,此方法为量化使用行为特征在语义上的差别定义了一组距离函数。在关系表示结构是有向根树的条件下,这些距离函数均满足三角不等式特性,在提高搜索效率方面具有优势,弥补了以往研究存在的缺陷。实验初步表明此类距离函数在最近邻查询效果和计算速度方面可与已有研究媲美。 (3)提出了一种新的支持站点设计优化的Web使用挖掘方案。此方案基于历史搜寻路径统计用户寻找目标花费的平均时间,用以量化Web页面的搜寻费用。在此基础上提出了一种高效的数据挖掘方法,寻找一组能够有效压缩搜寻路径(降低搜寻费用)的超链接。实验表明挖掘的结果能够提供许多有用的信息,帮助管理者及时发现站点设计中存在的问题。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王利;;Web挖掘在个性化学习网站中的应用[J];福建电脑;2006年01期
2 凌海峰,刘业政,杨善林;基于蚁群算法的用户导航模式挖掘的研究[J];合肥工业大学学报(自然科学版);2005年08期
3 贾瑛;;Web使用挖掘的数据预处理过程分析[J];科技信息;2011年21期
4 杜文华;Web使用挖掘综述[J];电脑开发与应用;2003年04期
5 赵宝华;;基于Web挖掘的互动式作业分配与评价系统[J];微型电脑应用;2009年02期
6 刘海泉;姚全珠;;Web使用挖掘在电子商务中的应用研究[J];计算机工程;2006年07期
7 阎娟;;Web使用挖掘技术的研究[J];文教资料;2006年24期
8 张彬;蒋涛;;基于个人Web使用挖掘的个性化服务研究[J];株洲工学院学报;2006年04期
9 郑天云;霍成义;;Web使用挖掘及应用研究[J];甘肃科技;2008年04期
10 丁一,卢正鼎;基于web挖掘的用户服务研究[J];计算机仿真;2004年06期
11 范利星;张水平;张凤琴;朱涛;;基于WEB使用挖掘的网站个性化服务系统的设计[J];计算机系统应用;2006年01期
12 张超林;刘丽珍;陈俊杰;;Web使用挖掘中网站结构和内容的作用[J];太原理工大学学报;2006年S1期
13 刘建涛;;基于Web使用挖掘的电子商务个性化服务研究[J];武汉理工大学学报(信息与管理工程版);2006年08期
14 张彬;蒋涛;;一个集成个人Web使用挖掘的个性化模型[J];福建电脑;2006年10期
15 张超林;刘丽珍;陈俊杰;;Web使用挖掘中网站结构和内容的作用[J];太原理工大学学报;2006年S2期
16 张翠英;蔡华利;刘娜;;电子商务个性化服务与Web使用挖掘技术[J];中国管理信息化(综合版);2007年02期
17 高怀金;李国慧;;基于遗传算法的Web使用挖掘研究[J];电脑知识与技术(学术交流);2007年18期
18 张彤;童向兰;;面向企业的Web使用挖掘研究[J];中小企业管理与科技(上旬刊);2008年07期
19 余肖生;;Web使用挖掘的可视化模型研究[J];情报杂志;2008年08期
20 杨斌;董祥军;;基于负关联规则的Web使用挖掘技术及发展趋势[J];微型机与应用;2009年24期
中国重要会议论文全文数据库 前10条
1 宋国杰;马帅;唐世渭;杨冬青;;基于模式挖掘的交通预测模型[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 袁晴晴;楼宇波;周皓峰;汪卫;施伯乐;;基于图论的频繁模式挖掘[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
3 刘业政;杨攀;杨慧;;基于Web使用挖掘的在线商业智能研究[A];第10届计算机模拟与信息技术会议论文集[C];2005年
4 于升峰;;WEB使用挖掘的模式发现[A];信息时代——科技情报研究学术论文集(第二辑)[C];2006年
5 谭小球;姚敏;顾沈明;;基于最大频繁序列模式树的个性化页面推荐[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
6 薛丹;李德敏;裴仁林;;移动计算中基于PrefixSpan算法的用户移动模式挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
7 陆叶;王丽珍;陈红梅;赵丽红;;基于可能世界的不确定空间co-location模式挖掘研究[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
8 赵立江;何钦铭;;聚类分析在个性化学习中的研究与应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
9 陈雷明;邹欣;党德玉;;一种基于语义优化非单调推理的方法[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
10 夏庆;马元元;孙志挥;;路径遍历模式挖掘方法的改进[A];第十六届全国数据库学术会议论文集[C];1999年
中国博士学位论文全文数据库 前10条
1 阮备军;Web使用挖掘若干关键问题研究[D];复旦大学;2004年
2 郑晓艳;频繁模式挖掘技术研究及其在供应链管理中的应用[D];天津大学;2010年
3 刘勇;图模式挖掘技术的研究[D];哈尔滨工业大学;2010年
4 李超锋;Web使用挖掘关键技术研究[D];华中科技大学;2007年
5 肖敏;基于领域本体的电子商务推荐技术研究[D];武汉理工大学;2009年
6 凌海峰;基于ACO的Web使用挖掘方法研究[D];合肥工业大学;2009年
7 周翀;搜索引擎中文档聚类方法研究[D];华中科技大学;2009年
8 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年
9 徐剑波;基于本体的电子政务资源管理系统研究[D];东华大学;2007年
10 杨厚群;半结构化数据频繁模式挖掘相关技术研究[D];重庆大学;2010年
中国硕士学位论文全文数据库 前10条
1 王书舟;基于Web挖掘的自适应网站研究[D];哈尔滨理工大学;2003年
2 汪曦东;Web使用挖掘方法的研究和实现[D];合肥工业大学;2004年
3 周军;基于图的模式挖掘及其应用研究[D];合肥工业大学;2009年
4 万宇文;用户访问模式在线挖掘推荐系统的研究[D];江西师范大学;2003年
5 梁爽;不同语义距离材料下概念结合创造过程的研究[D];西南大学;2010年
6 刘国光;基于聚类的Web使用挖掘研究[D];山东大学;2007年
7 段淑敏;数据挖掘在Web个性化服务中的应用研究[D];河南大学;2007年
8 王慧博;Web使用挖掘技术的研究[D];长春理工大学;2008年
9 胡德勇;基于电信数据的模式挖掘与分析[D];北京邮电大学;2010年
10 邓凯;基于Web使用挖掘和关联规则的页面推荐模型的研究与实现[D];华东师范大学;2007年
中国重要报纸全文数据库 前3条
1 记者 温婷 编辑 全泽源;上海文交所总裁张天:用创新模式挖掘“文化的北大荒”[N];上海证券报;2010年
2 本报记者 姚琳;科学与追求相伴[N];广西日报;2011年
3 记者 姚琳;广西两位专家入选国家“千人计划”[N];广西日报;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978