收藏本站
《中国科学技术大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

WEB2.0网络热点发现与个性化检索研究

陆铭  
【摘要】:近几年来,所谓的Web2.0网站和技术发展迅速,彻底改变了互联网的面貌。Web2.0网站强调自由创作和用户参与,数以亿计的网民在新一代的Web平台上创造了海量的生动有趣的内容。越来越丰富的互联网信息资源使得用户难以在浩如烟海的数据中找到其真正感兴趣的信息,因此,各种各样的信息检索和搜索引擎技术得到了广泛的关注和巨大的发展。 现有的Web信息检索系统主要是搜索引擎,但是已有的搜索引擎还是存在着很多不足,主要表现为:一是Web2.0网站的内容被收录的比例很少;二是给出的结果不能反映当前网络的流行信息和热点话题;三是检索结果没有针对用户的兴趣爱好来排序和筛选。针对以上几点问题,论文所要探讨的就是如何在Web2.0环境下,帮助用户根据自己的兴趣爱好从Web2.0的信息海洋里获取流行的热点话题。 论文主要针对Web信息检索中的Web2.0社区网络热点发现以及个性化推荐进行了研究,以更好地改善用户的检索体验。为了达到这个目标,论文首先提出了研究的框架,然后探讨各个重要组成模块的关键技术,并针对Web2.0网站的特点提出相应改进的算法与模型。论文的主要内容和创新之处为: 1.针对Web2.0网站信息组织和层次结构的特点,抽象出面向对象的分布式深度爬虫(Object-Oriented Distributed Deep Crawler,简称OODDC),使用较经济的带宽来与真实数据保持同步,大大提高了爬虫的工作效率和采集数据的实时性。实验结果也证实了面向对象的分布式实时深度爬虫的优点。 2.详细研究了Web2.0网站数据格式和内容标签(Tag)化的特点,在传统Web信息抽取算法基础上,结合向量空间模型(VSM)和实体识别算法,采用少数几个Tag及其权重组成的向量来描述网页、图片、视频和博客等Web对象信息本体的特征,建立了基于Tag描述的统一信息表示模型。 3.基于Tag描述的统一信息表示模型,改进了已有的话题检测与跟踪(TDT)算法,用快速的聚类算法检测和聚合网络话题;同时结合用户反馈对于信息流行程度的影响,提出一种有效的网络话题热度评估算法(HotRank),对所收集的话题计算其热度,作为排序和推荐的依据。实践表明,以相关度和热度共同作为检索结果的排序依据更加吸引用户。 4.针对现有用户兴趣模型的缺陷,提出一种基于主题的在线用户兴趣模型。此模型自动提取用户访问网页的主题,并随时根据用户兴趣的变化以非常小的代价更新。该用户兴趣模型可以运用到各种个性化服务中。实验证明基于此模型的个性化推荐系统具有良好的性能。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 林强;基于智能Agent的用户个性化检索系统的实现[J];图书馆学研究;2005年05期
2 朱前东;庞弘燊;;搜索引擎个性化检索研究综述[J];图书馆学刊;2008年06期
3 唐晓玲;何燕;;一种基于查询上下文的个性化检索模型研究[J];图书情报工作;2011年09期
4 黄伟祥;郝维;;个性化检索门户系统的设计与实现[J];沈阳工程学院学报(自然科学版);2006年04期
5 卢云;谭凯波;;基于Agent的旅游信息资源个性化检索研究[J];图书馆学研究;2007年03期
6 金燕;彭红彬;何小伟;姜文彬;;我的搜索听我的——基于用户兴趣的个性化信息检索方法探索[J];图书情报工作;2008年03期
7 刘志芳;;网络环境下的个性化检索定制服务[J];大学图书情报学刊;2006年05期
8 曹红兵;;搜索引擎的个性化检索研究[J];图书情报工作;2007年03期
9 陈争艳;朱保锋;;名人网页相关度评价的概率模型研究[J];河南教育学院学报(自然科学版);2008年01期
10 徐宽;王翠萍;;利用网格技术实现网络个性化检索[J];情报资料工作;2006年04期
11 卢林兰;李明;;用户ontology的构建及其在个性化检索中的应用[J];计算机应用;2006年11期
12 李英梅;;图书馆个性化信息检索探讨[J];新课程研究(职业教育);2008年07期
13 李琳;胡燕;刘东飞;;个性化Web信息检索排序算法优化研究[J];武汉理工大学学报;2010年16期
14 徐恺英;王硕;张射;常改;;基于人工神经网络的个性化检索模型[J];图书情报工作;2011年02期
15 唐晓玲;何天云;;基于主题偏好的个性化检索模型研究[J];情报杂志;2011年04期
16 吴芳;;基于用户情境及语义网技术的个性化搜索引擎[J];江西图书馆学刊;2011年04期
17 郭家义;个性化检索系统中的数据挖掘技术分析[J];图书情报工作;2003年08期
18 赵静;个性化信息检索及功能模型[J];图书与情报;2004年01期
19 崔建海,程妮,王军;W eb环境下的个性化信息检索技术[J];现代图书情报技术;2005年09期
20 罗金增;;基于模糊聚类的个性化Web信息检索系统研究[J];电脑知识与技术;2005年35期
中国重要会议论文全文数据库 前9条
1 赵琦;骆志刚;田文颖;李聪;丁凡;;一种基于负反馈信息的用户兴趣模型修正方法[A];中国通信学会第六届学术年会论文集(下)[C];2009年
2 宋巍;张宇;刘挺;李生;;基于检索历史上下文的个性化查询重构技术研究[A];第五届全国信息检索学术会议论文集[C];2009年
3 贾玉祥;昝红英;范明;;基于概率模型的网页相关度研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 张宇;范基礼;郑伟;邹博伟;刘挺;;基于人工标注的个性化检索系统评测的研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 邹博伟;张宇;范基礼;郑伟;刘挺;;基于改进的TextTiling方法的用户新兴趣发现的研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 张志涛;杨沐昀;李生;齐浩亮;宋超;;搜索引擎日志分析:协同推荐还是个性化检索[A];第五届全国信息检索学术会议论文集[C];2009年
7 张磊;李亚楠;王斌;李鹏;蒋在帆;;网页搜索引擎查询日志的session划分研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 任慧玲;胡铁军;李丹亚;钱庆;李军莲;诸文雁;杨滨;;结合CBM的十年发展历程谈医学网络数据库及其检索系统的发展趋势[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
9 刘琳;王慧芳;;基于情感语义的图像检索系统模型[A];第十二届全国图象图形学学术会议论文集[C];2005年
中国重要报纸全文数据库 前3条
1 应晓敏 窦文华;他山之石[N];计算机世界;2003年
2 郝莉;个性化数字图书馆[N];网络世界;2003年
3 应晓敏 窦文华;条条道路通罗马[N];计算机世界;2003年
中国博士学位论文全文数据库 前1条
1 陆铭;WEB2.0网络热点发现与个性化检索研究[D];中国科学技术大学;2012年
中国硕士学位论文全文数据库 前10条
1 杨斐斐;基于群组的个性化检索技术研究及应用[D];西北大学;2012年
2 宋兴华;基于用户模型的中文个性化检索系统研究[D];吉林大学;2011年
3 杨瑞峰;WEB上基于文本挖掘的个性化检索系统的设计与实现[D];电子科技大学;2003年
4 李光耀;基于分类技术的个性化检索系统的研究与设计[D];武汉理工大学;2013年
5 滕跃;基于用户兴趣的个性化WEB检索[D];清华大学;2004年
6 郇秀花;基于情景的个性化检索技术研究[D];安徽大学;2011年
7 余强;基于语义的设计知识个性化检索技术研究及应用[D];南京航空航天大学;2010年
8 贾玉祥;基于概率模型的名人网页相关度评价研究[D];郑州大学;2006年
9 王威;基于上下文的个性化信息检索技术研究[D];厦门大学;2009年
10 郑伟;个性化检索中相似用户群的获取与更新[D];哈尔滨工业大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978