收藏本站
《天津大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于用户浏览内容的Web用户浏览行为个性化研究

潘延军  
【摘要】:互联网与WWW以惊人的速度迅猛发展,使得设计与维护Web站点的工作变得尤为重要。摆在研究人员面前的新课题是如何管理WWW上的大量信息,以满足用户不断增长的个性化的信息需求。个性化服务技术已经成为当前信息服务领域的研究热点之一。所谓个性化服务就是指对不同的用户采取不同的服务策略,提供不同的服务内容,其关键在于必须知道用户的兴趣,并准确地建立用户兴趣模型。 本文首先对数据挖掘技术进行了阐述,进而分析了当前主要的Web挖掘技术和用户兴趣建模技术,提出了以Web用户浏览内容分析为主和以浏览行为分析为辅的用户兴趣挖掘过程模型。然后,初步研究和探讨了对文本页面的表示技术,包括:文本的向量空间模型表示、特征项的选择和抽取算法,将文本页面表示为结构化的向量空间模型格式。 接着,本文重点探讨了文本页面的聚类分析和用户兴趣模型的建立两个方面。通过文本之间的相似度计算,对文本集进行聚类分析。在比较了现有聚类算法和实际应用环境后,提出了将层次凝聚法(agglomerative algorithm)和平面划分法(K-means algorithm)相结合的新算法。在聚类结果的基础上,采用二层树状用户兴趣模型以加权矢量格式来表示每一个用户的兴趣。为了便于用户兴趣模型的使用和更新,每一兴趣类也采用向量空间模型来表示,内容页面与兴趣类的比较就可以采用常用的相似性函数来进行相似度计算。最后进行了模拟试验,使理论直观化了,具体化了。 通过试验也表明了本文所改进的聚类算法实现简单,准确率较高;提出的用户兴趣模型能较准确地描述用户兴趣所在,在个性化推荐服务中具有实际应用价值。
【学位授予单位】:天津大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP393.092

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 吴泓润;许斐;李申展;;个性化推荐系统中用户兴趣模型的研究[J];科技信息;2011年19期
2 杨树林;田卫东;;基于农业本体的用户兴趣模型研究[J];电脑知识与技术;2011年13期
3 唐晓玲;何燕;;一种基于查询上下文的个性化检索模型研究[J];图书情报工作;2011年09期
4 郝剑;高茂庭;;基于模糊相似度的RPCL文本聚类算法[J];电脑知识与技术;2011年18期
5 刘珺;张文欣;;基于RSS的层次结构用户兴趣模型的分析与设计[J];河南工程学院学报(自然科学版);2011年03期
6 冯霞;闫冠男;李娟娟;;一种基于潜在语义索引的谱聚类方法研究[J];中国民航大学学报;2011年03期
7 王春腾;符传谊;邢洁清;;一种改进的谱聚类方法及其在文本分析中的应用[J];电脑知识与技术;2011年16期
8 闫瑞瑞;马建国;;基于UCL的个性化主动信息服务实验研究[J];电视技术;2011年09期
9 吴庆涛;芮跃峰;张卫星;;个性化搜索引擎中的用户兴趣模型分析与研究[J];现代计算机;2011年08期
10 何峰;丁晓青;;结合文本聚类和文本检索的语料选取方法[J];高技术通讯;2010年12期
中国重要会议论文全文数据库 前10条
1 徐志明;宋毅;冯子威;李生;;一种基于分类的用户兴趣模型[A];第六届全国信息检索学术会议论文集[C];2010年
2 张猛;王大玲;于戈;;一种基于自动阈值发现的文本聚类方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 董婧灵;李芳;何婷婷;涂新辉;万剑;;基于LDA模型的文本聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 王乐;田李;贾焰;韩伟红;;一个并行的文本聚类混合算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
5 余珊珊;吴京慧;;个性化搜索引擎中用户兴趣模型的研究和设计[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
6 张宝艳;王庆辉;;中文文本聚类的研究与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
7 张刚;周昭涛;王斌;;基于主题的分布式信息检索研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
8 米晓红;;一种基于LSI的用户兴趣模型构建方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
9 张艳;章勇;;基于RSS信息服务的自适应用户兴趣模型研究[A];第七届中国通信学会学术年会论文集[C];2010年
10 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国重要报纸全文数据库 前2条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
2 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
2 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
3 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
4 何军;Internet中多媒体信息过滤技术的研究[D];电子科技大学;2002年
5 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年
6 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年
7 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
8 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
9 宣照国;文本挖掘算法及其在知识管理中的应用研究[D];大连理工大学;2008年
10 王乐;短语消息聚类相关技术研究[D];国防科学技术大学;2008年
中国硕士学位论文全文数据库 前10条
1 孙鑫;元搜索引擎结果个性化排序的研究与实现[D];中国石油大学;2008年
2 潘延军;基于用户浏览内容的Web用户浏览行为个性化研究[D];天津大学;2005年
3 何晏成;基于近邻传播和凝聚层次的文本聚类方法[D];哈尔滨工业大学;2010年
4 张金;个性化信息检索系统中文本聚类的研究[D];东北师范大学;2010年
5 庞俊;基于确定话题和情感极性的博客文本聚类研究[D];武汉理工大学;2010年
6 李梅;改进的K均值算法在中文文本聚类中的研究[D];安徽大学;2010年
7 王飞;基于蚁群优化的模糊文本聚类算法研究[D];河南工业大学;2010年
8 王玉伟;面向用户兴趣的web文档聚类研究[D];中国石油大学;2008年
9 赵颖;基于Ontology的Web文本聚类研究[D];西华大学;2011年
10 盛江涛;网络论坛话题发现与跟踪技术研究[D];哈尔滨工业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026