收藏本站
《重庆大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

用户浏览模式挖掘方法与应用研究

刘慧君  
【摘要】:随着WWW的迅速发展,Internet上的服务器积累了大量的Web日志数据,基于Web日志的使用挖掘是目前的研究热点之一。Web使用挖掘一个多学科交叉的研究领域,涉及到数据库技术、人工智能、神经网络、模式识别、统计学、模糊集、粗糙集等许多学科的理论。通过对Web日志进行挖掘,可以发现隐藏其中的知识和规律—用户的访问行为和访问兴趣,这些知识可以应用于个性化服务、Web站点系统改进以及商业智能等。 本文针对用户浏览模式的特点,就用户浏览模式挖掘方法和用户浏览模式挖掘应用2个方面进行了分析与研究,主要工作包括以下几个方面: 1.首先从用户浏览模式挖掘的4个方面:数据预处理、兴趣浏览模式发现、浏览模式聚类以及用户浏览模式应用研究,综述了国内外学者的经典的方法和最新的进展,并对相关研究成果进行详细地整理、归纳与分析。 2.在分析用户访问行为的基础上,充分考虑用户在路径选择上以及在页面上浏览表现出来的兴趣,提出了用户路径选择兴趣度以及页面浏览兴趣度的概念,设计了路径选择兴趣矩阵以及页面浏览兴趣矩阵,并基于两个矩阵设计了浏览兴趣路径挖掘算法,先通过对这两个矩阵进行综合浏览兴趣度计算得到所有的浏览兴趣子路径,最后进行子路径合并得到浏览兴趣路径。 3.考虑到不同的网页可能对用户来说具有不同的兴趣度,提出使用模糊综合评判方法来对网页的兴趣度进行评判,此外,用户在网页上的浏览时间对于分析用户的浏览兴趣是一个很重要的因素,为了忽略用户浏览时间上的细小区别,用户在网页上的浏览时间被刻画成模糊语言变量来描述用户的浏览兴趣,实现了基于模糊集的用户浏览模式挖掘算法,挖掘出来的浏览模式更符合人的推理方式。 4.提出了基于LCS的归纳化的用户浏览模式的聚类方法,在聚类过程中,该方法中使用LCS算法来获取会话之间的最长公共浏览序列,然后根据该公共浏览序列结合浏览兴趣、路径选择兴趣度来计算会话的相似性,同时为了减少会话的维数,提高算法的效率,按照网站的层次结构采用归纳化的方法对用户会话进行了归纳。 5.设计一种基于模糊粗糙集聚类用户浏览模式的方法,在该方法中,每个用户浏览模式被表示成等长的模糊向量的形式,以表示该用户访问过的网页以及浏览时间。在该模糊向量中,每个网页的都用其模糊区域的标势量的最大值来描述该网页的特征,同时给出了模糊粗糙集环境下的浏览模式的相异性度量,最后通过粗糙近似方法对用户浏览模式进行聚类。 6.在用户浏览模式的基础上提出了构建频繁浏览兴趣主干子网的算法,可以提取出Web网站被频繁访问的主干部分,为生成3G手机应用的WAP子网以及网站经营者的商务应用提供参考。 7.为了根据用户的访问兴趣以提供推荐,本文实现了一种的利用聚类分析结果和加权关联规则相结合进行个性化推荐的方法。在该方法中,根据用户的兴趣扩展了传统的关联关联规则挖掘方法,考虑了用户在网页上的浏览时间、浏览频度以及网页链入度等因素,针对每个聚类进行加权关联规则挖掘,计算用户会话属于哪个(些)聚类,再应用相对应的关联规则进行网页推荐服务。最后,对所做的工作进行了归纳与总结,提出了将来的研究方向和内容。
【学位授予单位】:重庆大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TP311.13

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 张辉;宋瀚涛;徐晓梅;;基于语义的Web用户会话识别算法[J];北京理工大学学报;2007年06期
2 梁杰;孙建伟;江飞;;基于D_S证据理论的Web事务识别方法[J];北京理工大学学报;2009年09期
3 鲍玉斌,王大玲,于戈;关联规则和聚类分析在个性化推荐中的应用[J];东北大学学报;2003年12期
4 孙惠琴,熊璋;基于粗集的模糊聚类方法和结果评估[J];复旦学报(自然科学版);2004年05期
5 殷贤亮;张为;;Web使用挖掘中的一种改进的会话识别方法[J];华中科技大学学报(自然科学版);2006年07期
6 宋擒豹,沈钧毅;Web日志的高效多能挖掘算法[J];计算机研究与发展;2001年03期
7 吴晶;张品;罗辛;盛浩;熊璋;;门户个性化兴趣获取与迁移模式发现[J];计算机研究与发展;2007年08期
8 陈敏;苗夺谦;段其国;;基于用户浏览行为聚类Web用户[J];计算机科学;2008年03期
9 王太雷;个性化推荐系统中相似模式聚类研究[J];计算机工程;2005年10期
10 曾万聃;周绪波;戴勃;常桂然;李春平;;关联规则挖掘的矩阵算法[J];计算机工程;2006年02期
中国博士学位论文全文数据库 前2条
1 吴瑞;模糊和粗糙环境下的网络用户浏览模式研究[D];天津大学;2006年
2 朱志国;Web用户使用模式与兴趣挖掘方法研究[D];大连理工大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 刘兴远,方顺兴,姚忠国;建筑结构试验数据处理的几种方法[J];四川建筑科学研究;1993年02期
2 杨平;;公路工程施工招标评标的层次分析法[J];四川建筑科学研究;2006年01期
3 徐文婷;李承鹏;;基于自适应遗传算法的离散化方法[J];合肥师范学院学报;2011年03期
4 蔡莉;胡学钢;;一种基于粗集的决策表求核算法[J];安徽大学学报(自然科学版);2007年06期
5 周玉华;李景杰;;不完备决策表的一种属性约简方法[J];安徽大学学报(自然科学版);2009年04期
6 杨萍,万上海,陈耿;一种基于可变支持度的缺省规则挖掘算法[J];安徽工程科技学院学报(自然科学版);2004年02期
7 孙全玲;基于粗集和神经网络的建模方法研究[J];安徽建筑工业学院学报(自然科学版);2005年02期
8 孙虹;方敏;;基于Rough集和RBF网络的车牌字符识别方法[J];安徽建筑工业学院学报(自然科学版);2006年04期
9 孙虹;;粗糙集神经网络系统在车牌字符识别中的研究[J];安徽建筑工业学院学报(自然科学版);2007年04期
10 邓胜;戴小鹏;陈垦;黄璜;;粗糙集理论在农业生物灾害预测中的应用[J];安徽农业科学;2010年06期
中国重要会议论文全文数据库 前10条
1 李昆仲;许清丽;杨凡;;基于GIS的洛阳市矿山地质环境分区评价[A];河南地球科学通报2009年卷(下册)[C];2009年
2 危前进;董荣胜;孟瑜;崔更申;;基于粗糙集的机械装配知识发现方法[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
3 常河;;模糊层次分析法在含能材料作业安全评价中的应用[A];全国危险物质与安全应急技术研讨会论文集(下)[C];2011年
4 ;Fuzziness in Covering Generalized Rough Sets[A];第二十六届中国控制会议论文集[C];2007年
5 李雄;党生;;基于Rough集理论的战场侦察情报处理[A];第二十六届中国控制会议论文集[C];2007年
6 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
7 龚锦红;杨辉;衷路生;;稀土萃取分离过程的Rough集案例推理方法[A];第二十九届中国控制会议论文集[C];2010年
8 ;Influence Diagram Based on Rough Set Theory[A];第二十九届中国控制会议论文集[C];2010年
9 ;The Prediction of Soil Moisture Based on Rough Set-Neural Network Model[A];第二十九届中国控制会议论文集[C];2010年
10 ;Incremental Clustering for Categorical Data Using Clustering Ensemble[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 刘雪梅;服务器端软件性能分析和诊断方法研究[D];哈尔滨工程大学;2010年
2 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
3 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
4 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
5 冯光升;面向认知网络的自适应QoS感知与配置方法[D];哈尔滨工程大学;2009年
6 姜延吉;多传感器数据融合关键技术研究[D];哈尔滨工程大学;2010年
7 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
8 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
9 苏煜;基于SCF范式的在线P300脑机接口研究[D];浙江大学;2010年
10 郭戈;数字视频语义信息提取与分析[D];解放军信息工程大学;2010年
中国硕士学位论文全文数据库 前10条
1 王旭;资源型城市生态经济系统可持续发展研究[D];河南理工大学;2010年
2 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
3 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
4 蔡宏果;基于基因表达式编程的Web个性化推荐技术研究[D];广西师范学院;2010年
5 聂剑锋;基于QoS的Web服务选择研究[D];浙江理工大学;2010年
6 张晓冬;基于全矢谱的智能诊断技术研究[D];郑州大学;2010年
7 李昕哲;关系邻域系统的属性约简[D];郑州大学;2010年
8 刘琪;正态云模型模糊推理系统及其应用研究[D];郑州大学;2010年
9 赵红玲;液态奶评价方法及其体系稳定性影响的研究[D];山东农业大学;2010年
10 冯为军;基于粗糙集理论的数据挖掘算法的研究[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 张辉;宋瀚涛;徐晓梅;;基于语义的Web用户会话识别算法[J];北京理工大学学报;2007年06期
2 黄进,尹治本;关联规则挖掘的Apriori算法的改进[J];电子科技大学学报;2003年01期
3 杨明,孙志挥,吉根林;一种基于分布式数据库的全局频繁项目集更新算法[J];东南大学学报(自然科学版);2002年06期
4 王宏伟,詹荣开,贺汉根;基于模糊聚类的改进模糊辨识方法[J];电子学报;2001年04期
5 骆洪青,吴小俊,曹奇英;模糊聚类分析的一种新方法研究[J];华东船舶工业学院学报;2000年03期
6 殷贤亮;张为;;Web使用挖掘中的一种改进的会话识别方法[J];华中科技大学学报(自然科学版);2006年07期
7 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期
8 王实,高文,李锦涛,谢辉;路径聚类:在Web站点中的知识发现[J];计算机研究与发展;2001年04期
9 林鸿飞;基于混合模式的文本过滤模型[J];计算机研究与发展;2001年09期
10 赵亮,胡乃静,张守志;个性化推荐算法设计[J];计算机研究与发展;2002年08期
中国博士学位论文全文数据库 前1条
1 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年
【相似文献】
中国期刊全文数据库 前10条
1 李云峰;;隐私浏览,谁都行![J];电脑爱好者;2008年24期
2 葛宇;;用光影看看给照片浏览加彩框[J];电脑迷;2009年06期
3 何雷超;;用Google Earth遨游宇宙[J];电脑迷;2007年19期
4 王志军;;用好腾讯微博的图片浏览模式[J];网友世界;2011年14期
5 施建生,伍卫国,陆丽娜,杨怡玲;Web日志中挖掘用户浏览模式的研究[J];西安交通大学学报;2001年06期
6 栾勇,李宏;银行卡用卡行为关联规则挖掘[J];华南金融电脑;2005年10期
7 王志军;;激活IE8光标浏览模式[J];电脑迷;2009年03期
8 雷红艳,邹汉斌;无最小支持度的关联规则挖掘方法[J];湖南文理学院学报(自然科学版);2005年02期
9 范利星;张水平;张凤琴;朱涛;;基于WEB使用挖掘的网站个性化服务系统的设计[J];计算机系统应用;2006年01期
10 夏敏捷;张慧档;;基于Web日志挖掘的个性化服务站点[J];微计算机应用;2006年01期
中国重要会议论文全文数据库 前10条
1 潘海为;李建中;张炜;;挖掘脑部医学图像中的关联规则[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
2 周水庚;胡运发;陶晓鹏;;分布数据库关联规则的递增挖掘[A];第十五届全国数据库学术会议论文集[C];1998年
3 左万利;刘居红;;包含正负属性的关联规则及其挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
4 王宁;董淳;胡运发;陶晓鹏;;面向集合的关联规则挖掘算法[A];第十五届全国数据库学术会议论文集[C];1998年
5 李阳;徐锡山;韩伟红;郑黎明;徐镜湖;;网络安全事件关联规则的自动化生成方法研究与实践[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
6 周焕银;张永;;关联规则候选项频度规律研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
7 李庆忠;张世栋;董国庆;;在数据多维体中进行关联规则的挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
8 韩涛;张春海;;关系数据库中关联规则的高效挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
9 方艳;别荣芳;;关联规则的有趣性研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 黄晓燕;许龙飞;;基于关联规则的网络入侵检测技术的应用研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
中国重要报纸全文数据库 前10条
1 陈青;谁在阻止RSS的普及[N];中国电脑教育报;2005年
2 专家 陈锟;专家坐堂之数码篇[N];电脑报;2004年
3 兔兔鱼、泡泡糖;玩转数码相机之解读数码照片[N];中国电脑教育报;2002年
4 ;专家坐堂之数码篇[N];电脑报;2003年
5 ;“面子”够大的 柯达LS633[N];电脑报;2003年
6 ;奥林巴斯μ300数码相机[N];电脑报;2003年
7 本报记者 肖春江;软件:直向网络[N];计算机世界;2000年
8 ;联想SoShow730[N];电脑报;2003年
9 重庆 李全新;看CAD图,谁更专业?[N];电脑报;2005年
10 广东 晓清;三款具备娱乐功能的数码相机[N];电子报;2007年
中国博士学位论文全文数据库 前10条
1 刘慧君;用户浏览模式挖掘方法与应用研究[D];重庆大学;2010年
2 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
3 赵春;基于数据挖掘技术的财务风险分析与预警研究[D];北京化工大学;2012年
4 朱志国;Web用户使用模式与兴趣挖掘方法研究[D];大连理工大学;2010年
5 李实;中文网络客户评论中的产品特征挖掘方法研究[D];哈尔滨工业大学;2009年
6 谭华;不确定时态数据挖掘方法及其在证券行情预测中的应用[D];湖南大学;2008年
7 贾俊杰;空间数据挖掘中若干关键技术研究[D];长安大学;2009年
8 肖波;可信关联规则挖掘算法研究[D];北京邮电大学;2009年
9 谢海涛;移动个性化信息服务系统的进化机制研究[D];北京邮电大学;2012年
10 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年
中国硕士学位论文全文数据库 前10条
1 岳慧颖;含有时空约束的关联规则挖掘方法研究[D];哈尔滨工程大学;2004年
2 赵春胜;基于关联规则的数据挖掘方法在电厂脱硫监测中的应用研究[D];内蒙古大学;2011年
3 于青子;具有明确语义的关联规则挖掘系统的研究与实现[D];河海大学;2002年
4 吴胜兵;Web数据挖掘的应用与研究[D];南昌大学;2007年
5 王景;基于关联规则数据挖掘的研究[D];广西大学;2003年
6 涂明;关联规则增量式更新算法研究[D];合肥工业大学;2010年
7 聂倩雯;基于关联规则数据挖掘和扩展贝叶斯网络的电网故障诊断方法研究[D];西南交通大学;2010年
8 蒋秀英;数据挖掘中的关联规则算法优化研究及应用[D];山东师范大学;2003年
9 孙彤;活性炭纤维吸附和解吸中的数据挖掘技术[D];辽宁工程技术大学;2004年
10 王烁;关联规则数据挖掘中经典频集算法改进的研究[D];天津大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026