收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于图学习的Web信息检索技术研究

管子玉  
【摘要】: 随着互联网和万维网(World Wide Web)的快速繁荣发展,万维网逐渐成为人们生活中不可或缺的一种信息获取来源。万维网给信息检索技术带来了极大的机遇和挑战。经过最近十几年的发展,信息检索已经由一个纯粹的学术研究学科转变成大多数人信息获取的技术基础。 随着Web 2.0概念的普及和发展,万维网不再仅仅是一个巨大的信息库,更逐渐成为一个用户参与和交流的平台。Web 2.0应用网站的蓬勃发展将再次推动信息检索技术的革新。本文认为,在Web 2.0时代,信息检索技术主要有以下三方面的发展趋势:1)更加灵活的个性化信息服务。随着用户的急剧增加,Web 2.0网站迫切需要满足用户的个性化信息需求。然而,传统的Web信息检索技术并不擅长处理Web 2.0应用的复杂结构数据。Web 2.0需要更加灵活的个性化信息服务,如信息推荐系统。2)更加有效的多媒体数据检索技术。随着Web 2.0的普及,用户可以很方便地上传和分享多媒体信息。多媒体数据的迅速增多使得多媒体信息检索技术成为人们关注的焦点。3)检索服务的专业化。当前,Web 2.0应用中的用户产生数据已经成为万维网这个巨大信息库的重要组成部分之一。过于繁杂的Web数据使得Web信息检索向领域化、专业化方向发展。 很多Web数据呈现复杂的内在关联结构。本文指出,为了更好地解决这些数据上的相关检索问题、提升检索效果,就需要充分利用蕴含在数据复杂关联结构中的知识。图学习技术能够对复杂关联结构进行较好地建模并捕捉其中蕴含的知识。因此,结合上述发展趋势,本文研究工作围绕基于图学习的Web信息检索技术展开,具体在以下四个相关研究问题上进行深入研究并提出了新颖的图学习算法: 1) Web 2.0社区化标签应用中的个性化标签推荐:社区化标签应用中用户可以对资源任意地加标签。产生的标签标注数据可以很自然地用图来建模。本文提出一种新的基于图的多类关联对象查询排序算法,以解决社区化标签应用中的个性化标签推荐问题。 2)Web 2.0社区化标签应用中的个性化文档推荐:传统的信息推荐系统聚焦在评级打分数据上,而社区化标签应用中的标签标注数据是一种不同的且具有特殊图结构的数据。本文提出一种新的基于图的多类关联对象降维(语义空间学习)算法,将用户、标签和文档映射到同一语义空间中,然后根据用户与文档之间的欧式距离来进行文档推荐。 3)人脸图像检索与识别:传统的人脸检索和识别研究利用降维技术(子空间学习)来获得人脸图像的高层次特征表达。最近提出的一种基于图的二阶张量子空间学习算法在人脸图像上表现比较出色,但是其时间复杂度比较高。本文提出一种新的基于图的高效二阶张量子空间学习算法,在保证可接受的检索、识别性能的同时,降低了学习子空间映射函数的时间复杂度。 4)高质量专业Web资源抓取:聚焦爬虫是从Web上抓取主题相关信息资源的一种重要技术手段。对垂直搜索引擎来讲,最重要的研究问题之一是如何从Web中把高质量的相关资源找出来。本文提出一种新的基于Web图的网页主题质量在线评估算法,并在此基础上设计了一个获取高质量主题相关Web资源的聚焦爬虫。 文章最后总结了本文工作,并对基于图学习的Web信息检索技术发展前景进行展望。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张培宾;;WEB信息检索综述[J];黑龙江科技信息;2011年14期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前8条
1 张敏;马少平;高剑锋;;基于链接的方法进行Web信息检索的TREC实验研究(英文)[A];第一届学生计算语言学研讨会论文集[C];2002年
2 沈锡宾;杨先海;吴国仕;;基于Web 2.0技术的公开评议开放存取期刊管理系统的分析与设计[A];第七届中国科技期刊发展论坛论文集[C];2011年
3 靖培栋;王英;;Web 2.0在政府信息工作中的应用[A];科学发展:社会管理与社会和谐——2011学术前沿论丛(上)[C];2011年
4 张敏;马亮;马少平;陈群秀;;TREC2002介绍及清华大学实验研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 焦冉;;基于Library 2.0的图书馆信息服务[A];信息资源配置理论与模型研究——2009信息化与信息资源管理学术研讨会专集[C];2009年
6 黄家乾;吴升;;Mashup技术在web地图中的应用[A];2009`中国地理信息产业论坛暨第二届教育论坛就业洽谈会论文集[C];2009年
7 李贺华;付鹤岗;;多Agent Web信息检索应用研究[A];2008年计算机应用技术交流会论文集[C];2008年
8 杨上影;周涛;蒋洪钢;;AJAX技术在公众地图服务网站的应用[A];全国测绘科技信息网中南分网第二十一次学术信息交流会论文集[C];2007年
中国博士学位论文全文数据库 前5条
1 管子玉;基于图学习的Web信息检索技术研究[D];浙江大学;2010年
2 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
3 沈筱彦;Web信息检索若干关联挖掘问题的研究[D];北京邮电大学;2009年
4 王灿;基于半监督流形学习的Web信息检索技术研究[D];浙江大学;2009年
5 冯国臻;基于结构分析的大规模WWW文本信息检索技术的研究[D];中国科学院研究生院(计算技术研究所);2001年
中国硕士学位论文全文数据库 前10条
1 董志勇;Web信息检索中基于超链接的网页评估算法的研究[D];河海大学;2004年
2 李政;基于WEB 2.0的手机报形态研究[D];中央美术学院;2010年
3 苏日娜;WEB 2.0背景下政府对微博客舆论的应对与应用策略研究[D];内蒙古大学;2011年
4 马超;Web 2.0环境下数字图书馆的服务模型研究[D];西安电子科技大学;2011年
5 徐永红;基于专题信息服务的智能搜索引擎技术研究[D];国防科学技术大学;2004年
6 林剑剑;基于网络的研究生学习共同体的研究与设计[D];上海外国语大学;2009年
7 丁少璋;基于Enterprise2.0的新商业模式研究[D];复旦大学;2009年
8 梁恒;Web2.0时代网络社区及其内部互动研究[D];吉林大学;2009年
9 胡一俊;web超链分析应用研究[D];武汉大学;2005年
10 何娟;DynamicView中信息抽取系统的设计与实现[D];东南大学;2006年
中国重要报纸全文数据库 前3条
1 实习记者 梁晓飞;Web 2.0峰会盘点网络格局[N];计算机世界;2010年
2 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;“海”中捞“珍”[N];计算机世界;2003年
3 梅竹;清华摘取国际信息检索比赛两项桂冠[N];计算机世界;2002年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978