收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

Web 2.0环境下互联网信息过滤理论与方法研究

李东方  
【摘要】: 互联网近年来得到了迅猛发展,伴随着Web 2.0等技术的不断进步,互联网承载的应用与信息活动越来越多,人们对互联网的依赖程度也越来越高。在Web 2.0时代,一方面,互联网上的媒体类型呈现多样化特点。多媒体信息携带的听觉和视觉信息与传统的文本信息成互补,有效的丰富了互联网上的信息内容和用户浏览体验。如何针对多种媒体信息进行有效过滤是Web 2.0下信息过滤的重要任务。另一方面,在Web 2.0时代,用户为互联网的中心。互联网呈现出社会性与动态特性,大量动态的数据涌现。这些数据极大的丰富了互联网内容,给人们提供了众多的信息来源。如何从这些用户创造的数据中学习用户的习惯并过滤其中的热点信息成为互联网的重要的研究课题。此外,海量的用户参与为互联网带来了海量数据,如何改进传统算法以适应这些海量数据成为重要的研究课题。本文的研究重点是Web 2.0下信息过滤。本文分析了Web 2.0下信息过滤任务面临的挑战,我们分别对多种媒体信息综合过滤、应用于海量数据的学习算法和挖掘Web 2.0用户丰富的反馈数据进行了研究,并提出了应对这些问题的理论与方法。 论文的主要研究内容与创新成果如下: 本文针对Web 2.0时代多种媒体信息并存的特点提出了综合多种媒体特征的信息过滤方法。并针对互联网中广告图片过滤问题,综合利用网页中文本信息、图片内容信息等,结合SVM和AdaBoost学习算法,有效的实现了对广告图片的过滤。本文提取了丰富的媒体内容特征、相关的页面布局特征和文本特征。并基于AdaBoost提出了特征选取办法,对特征集合进行筛选和有机的整合。本文还构建了一个大规模的实验数据集来对算法进行验证。验证结果证实了算法特征集选取的合理性及特征选取算法的可行性。本文还对比了各种特征的分类效果及分类有效性。 本文基于Normalized Cut提出了一种快速谱聚类算法FSC来对互联网上的海量的文本数据进行快速聚类。本文中分析了谱聚类算法应用到大规模文本聚类中的难点,并给出了解决办法。FSC首先利用GSASH算法将大规模的高维文本数据快速表示为图,并利用AMG数值分析方法将谱分析对应的大规模特征值系统迭代化简为较小规模特征值系统,进而取得近似解。本文还从理论角度分析了这种近似的有效性。实验结果表明,FSC保持了谱聚类算法优点,并且成功的将算法复杂度降低到O(nlogn),进而可以应用到大规模文本聚类问题上来。 本文基于热量扩散模型提出了一种针对Web 2.0环境下的信息热度评价与挖掘算法。本文针对Web 2.0时代互联网呈现出的社会性与动态特性,对Web 2.0时代的互联网进行建模。本文将互联网上用户的信息活动看作为热度活动,建立互联网热量扩散模型,利用用户反馈信息对互联网上的信息进行热度评估,并挖掘其中的热点。本文对热度模型进行了详细的定义,并证明了其稳定性和算法收敛性。实验结果表明本文的算法能很好的模拟互联网上的信息活动。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王欣;吴霞;;基于Web2.0技术的数字图书馆服务[J];现代电信科技;2009年11期
2 肖华妹;;Web 2.0在网络课程中的应用[J];电脑编程技巧与维护;2010年06期
3 吴曦;;Web2.0对政府行为的影响和效果分析[J];财经界(学术版);2010年05期
4 胡玲静;;用Web 2.0技术构建基于建构主义学习理论的网络教学平台[J];中国教育信息化;2010年23期
5 任仙姬;;Web 2.0在图书馆网站构建中的应用[J];数字技术与应用;2010年01期
6 郑晓华;;基于Web 2.0技术的图书馆服务研究[J];农业网络信息;2011年05期
7 邵敏;杨玉强;韩丽艳;;应用wiki技术构建主题网络资源库的理论探索[J];中国现代教育装备;2007年05期
8 尹雪;;图书馆营销之新形式——由短剧《早安,图书馆》引发的思考[J];上海高校图书情报工作研究;2009年03期
9 鲍清强;;Web 2.0在图书馆服务模式创新中的应用策略研究[J];吉林省教育学院学报(学科版);2008年07期
10 赵春琳;;Web 2.0环境下基于用户参与的信息组织研究[J];中国索引;2010年01期
11 郭雨齐;窦红光;王桂颖;;Web 2.0时代下的科技期刊网站[J];中国科技期刊研究;2008年03期
12 杜慧;;信息网络发展对数字图书馆的影响和促进[J];上海高校图书情报工作研究;2007年02期
13 张蕾;王宇;;Library 2.0环境下的虚拟参考咨询工作[J];中华医学图书情报杂志;2008年05期
14 金悦奇;柏昌顺;;基于Web2.0模式的高校学生实习管理系统的设计与实现[J];办公自动化;2009年20期
15 李静;王建军;;Web 2.0时代大学生个人知识管理探析[J];电脑知识与技术;2009年28期
16 杨海燕;;也谈图书馆的网站建设[J];学理论;2011年05期
17 孙丽;王丽伟;;图书馆2.0服务模式构建[J];医学信息学杂志;2011年08期
18 姚雪梅;;Web 2.0技术在高校图书馆信息共享空间建设中的应用[J];高校图书馆工作;2011年05期
19 王亮;;Web 2.0的新应用——Second Life[J];现代电信科技;2007年12期
20 张天俊;;Mashup技术在校园网站中的应用[J];电脑知识与技术;2009年24期
中国重要会议论文全文数据库 前5条
1 沈锡宾;杨先海;吴国仕;;基于Web 2.0技术的公开评议开放存取期刊管理系统的分析与设计[A];第七届中国科技期刊发展论坛论文集[C];2011年
2 靖培栋;王英;;Web 2.0在政府信息工作中的应用[A];科学发展:社会管理与社会和谐——2011学术前沿论丛(上)[C];2011年
3 焦冉;;基于Library 2.0的图书馆信息服务[A];信息资源配置理论与模型研究——2009信息化与信息资源管理学术研讨会专集[C];2009年
4 黄家乾;吴升;;Mashup技术在web地图中的应用[A];2009`中国地理信息产业论坛暨第二届教育论坛就业洽谈会论文集[C];2009年
5 杨上影;周涛;蒋洪钢;;AJAX技术在公众地图服务网站的应用[A];全国测绘科技信息网中南分网第二十一次学术信息交流会论文集[C];2007年
中国博士学位论文全文数据库 前1条
1 管子玉;基于图学习的Web信息检索技术研究[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 程璇;Web 2.0环境下高校图书馆信息服务评价研究[D];西北大学;2013年
2 李政;基于WEB 2.0的手机报形态研究[D];中央美术学院;2010年
3 苏日娜;WEB 2.0背景下政府对微博客舆论的应对与应用策略研究[D];内蒙古大学;2011年
4 王燕佳;基于Web 2.0的Flex智能化网络信息系统的设计与实现[D];电子科技大学;2011年
5 马超;Web 2.0环境下数字图书馆的服务模型研究[D];西安电子科技大学;2011年
6 林剑剑;基于网络的研究生学习共同体的研究与设计[D];上海外国语大学;2009年
7 丁少璋;基于Enterprise2.0的新商业模式研究[D];复旦大学;2009年
8 梁恒;Web2.0时代网络社区及其内部互动研究[D];吉林大学;2009年
9 马克辛;基于Web2.0的物理自主学习网络社区平台的构建研究[D];山东师范大学;2008年
10 宋勋祥;关于实施WEB 2.0旅游网络营销的研究[D];江南大学;2008年
中国重要报纸全文数据库 前1条
1 实习记者 梁晓飞;Web 2.0峰会盘点网络格局[N];计算机世界;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978