收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于链接分析的Web社区发现研究与应用

李翠  
【摘要】: 随着网络信息资源的急剧膨胀,如何从中抽取出潜在的、有价值的信息,进而充分有效地利用Web信息资源,是当今信息领域重要又极具挑战性的研究课题。而对Web社区发现的研究具有一定的实际应用价值,Web社区是Web组织中非常重要的信息,它可以对互联网信息进行各种意义上的划分,反映Web中普遍存在的、复杂的聚团关系和层次关系。 Web页面之间的链接关系为Web社区发现研究提供了极其丰富的信息线索,Web社区发现主要依据的是链接分析技术。从链接结构中获取有用的拓扑关系,可进一步分析其所对应的功能或语义内涵,有效实现无用信息的过滤。将Web社区发现算法应用于搜索引擎中有助于提高Web信息搜索的性能与精确度,并可在一定程度上实现信息的聚类。 本文在分析当前Web及其数据特征、Web拓扑结构建模方法、Web拓扑结构模型、信息检索模型及搜索引擎体系结构的基础上,以链接分析技术为支撑,研究了Web社区发现典型算法并提出了改进算法,同时在现有搜索软件及其工具包基础上构建了其应用系统原型。探讨了如何根据Web社区发现算法对Web信息集合进行有效的聚类划分和直观易懂的描述,对改善搜索引擎的搜索结果有一定的理论及应用价值。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 何拥军,骆嘉伟,孙星明;应用链接分析的web搜索结果聚类[J];计算机工程与应用;2005年02期
2 李洁;;基于Web的信息检索技术分析与研究[J];电脑知识与技术;2010年26期
3 朱红灿;肖子昂;;基于聚类的Web链接抽取[J];网络安全技术与应用;2009年03期
4 陈太洋;;我国大学图书馆网站链接的实证分析——以中国“211工程”高校为例[J];图书馆杂志;2007年03期
5 周涛;陈向东;;基于链接分析的网站评价[J];广西教育学院学报;2008年04期
6 刘彦祖;;Web of Science数据库中网络链接分析研究论文的定量分析[J];情报探索;2010年02期
7 刘兵;;基于JavaScript等多链接分析的主题爬虫设计实现[J];许昌学院学报;2010年02期
8 林明东;;我国省级档案信息网站的链接分析[J];云南档案;2010年07期
9 吴华香,钟少丹;网络计量学的应用分析[J];图书情报工作;2003年08期
10 邱均平;陈敬全;段宇锋;;中国大学网站链接分析及网络影响因子探讨[J];中国软科学;2003年06期
11 董江山,胡吉祥,邱均平;链接分析法及其应用[J];情报科学;2004年09期
12 陈丽萍;;谈基于链接分析的web社区发现技术[J];科技信息;2009年31期
13 苏娜;张志强;刘志辉;;基于链接分析的图林博客显著度分析[J];情报资料工作;2010年01期
14 柳朝阳;用聚类回归模型预测粮食产量[J];计算机应用;1988年06期
15 阎辉,张学工,李衍达;基于核函数的最大间隔聚类算法[J];清华大学学报(自然科学版);2002年01期
16 陈定权;Web信息检索技术最新进展[J];现代图书情报技术;2002年02期
17 颜雪松,蔡之华;一种快速聚类高维数据的算法研究[J];计算机工程;2003年01期
18 刘志成,文全刚;“K-中心点”聚类算法分析及其实现[J];电脑知识与技术;2005年06期
19 王元珍,陈涛;基于归类的链接分析技术[J];计算机工程与应用;2005年13期
20 熊家军,涂静,李庆华;入侵检测聚类中相似性度量的等效性研究[J];计算机工程;2005年07期
中国重要会议论文全文数据库 前10条
1 武森;金海燕;高学东;;数据挖掘中CABOSFV聚类算法的实现与应用[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年
2 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年
3 穆向禹;浦剑涛;张树武;徐波;;基于状态子空间聚类的多层MLLR自适应算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 饶鲜;李斌;杨绍全;;用核聚类法进行异常检测[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
5 杨广林;赵云峰;王书理;;Gabor滤波器及其在图像特征提取方面的优化算法[A];2005年中国智能自动化会议论文集[C];2005年
6 冯又层;蔡勖;;基于自组织特征映射的证券市场聚类[A];第二届全国复杂动态网络学术论坛论文集[C];2005年
7 张刚;刘悦;;基于查询空间的分布式文档集合划分算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 文健;李舟军;;基于聚类语言模型的生物文献检索技术研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 高阳;赵瑞娜;赵志强;阿杉;;基于自组织特征映射网络的全国地级市城市地价区域分类研究[A];地理学与生态文明建设——中国地理学会2008年学术年会论文摘要集[C];2008年
10 刘哲;唐雁;陈强;;三维模型有意义分割技术现状及应用[A];2008年计算机应用技术交流会论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;2010年
2 马赓宇;基于HMM的时间序列聚类与识别[D];清华大学;2004年
3 蔡维玲;基于聚类的图像分割和分类器设计的研究[D];南京航空航天大学;2008年
4 张伟;基于WWW的聚类引擎研究[D];重庆大学;2003年
5 雷景生;神经网络的分类、聚类功能及其规则抽取研究[D];新疆大学;2003年
6 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
7 钱晓东;基于神经网络等技术的数据与文本聚分类研究[D];天津大学;2005年
8 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
9 段宇锋;网络链接分析与网站评价研究[D];武汉大学;2004年
10 贾俊杰;空间数据挖掘中若干关键技术研究[D];长安大学;2009年
中国硕士学位论文全文数据库 前10条
1 李翠;基于链接分析的Web社区发现研究与应用[D];西安理工大学;2007年
2 王斌;双层数据流聚类框架的设计与实现[D];吉林大学;2004年
3 蔡博文;高维数据集中离群数据挖掘方法的研究[D];合肥工业大学;2006年
4 刘晓燕;基于聚类的入侵检测系统研究[D];青岛大学;2006年
5 于世东;多维数据可视化技术的研究及应用[D];沈阳工业大学;2006年
6 戴金;改进K-MEANS算法及在Ⅰ型糖尿病血糖值的聚类应用[D];北京交通大学;2011年
7 孙会岭;移动环境中基于聚类的个性化推荐算法研究[D];燕山大学;2011年
8 郑国荣;基于电信CRM系统的客户消费模式研究[D];重庆大学;2005年
9 王清江;基于力学的聚类算法[D];大连理工大学;2006年
10 张锦;关于一种混合式入侵检测系统的研究与设计[D];沈阳工业大学;2006年
中国重要报纸全文数据库 前10条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
2 王云鹤 熊立;武汉电信直销中心剑指聚类市场[N];人民邮电;2009年
3 记者 肖卓;聚类市场:想挖金矿不容易[N];人民邮电;2009年
4 张秋;突破聚类市场的信息化盲区[N];中国计算机报;2007年
5 符信;30个指标评价社会发展水平[N];南方日报;2005年
6 记者 李远治 通讯员 邹超 敖翔;重庆号百传媒探索聚类市场新模式[N];人民邮电;2009年
7 本报记者 薛海滨;四大概念技术秀[N];计算机世界;2005年
8 长江期货 韩锦 邹云峰 高华;基于RFM模型的聚类分析算法在期货公司客户分类中的应用[N];期货日报;2008年
9 武德锋 李国辉 林洪文 姚作梁;图像世界任我行[N];计算机世界;2002年
10 本报记者 许愿;顾客的终生价值[N];机电商报;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978