基于链接分析的Web社区发现研究与应用
【摘要】:
随着网络信息资源的急剧膨胀,如何从中抽取出潜在的、有价值的信息,进而充分有效地利用Web信息资源,是当今信息领域重要又极具挑战性的研究课题。而对Web社区发现的研究具有一定的实际应用价值,Web社区是Web组织中非常重要的信息,它可以对互联网信息进行各种意义上的划分,反映Web中普遍存在的、复杂的聚团关系和层次关系。
Web页面之间的链接关系为Web社区发现研究提供了极其丰富的信息线索,Web社区发现主要依据的是链接分析技术。从链接结构中获取有用的拓扑关系,可进一步分析其所对应的功能或语义内涵,有效实现无用信息的过滤。将Web社区发现算法应用于搜索引擎中有助于提高Web信息搜索的性能与精确度,并可在一定程度上实现信息的聚类。
本文在分析当前Web及其数据特征、Web拓扑结构建模方法、Web拓扑结构模型、信息检索模型及搜索引擎体系结构的基础上,以链接分析技术为支撑,研究了Web社区发现典型算法并提出了改进算法,同时在现有搜索软件及其工具包基础上构建了其应用系统原型。探讨了如何根据Web社区发现算法对Web信息集合进行有效的聚类划分和直观易懂的描述,对改善搜索引擎的搜索结果有一定的理论及应用价值。
|
|
|
|
1 |
何拥军,骆嘉伟,孙星明;应用链接分析的web搜索结果聚类[J];计算机工程与应用;2005年02期 |
2 |
李洁;;基于Web的信息检索技术分析与研究[J];电脑知识与技术;2010年26期 |
3 |
朱红灿;肖子昂;;基于聚类的Web链接抽取[J];网络安全技术与应用;2009年03期 |
4 |
陈太洋;;我国大学图书馆网站链接的实证分析——以中国“211工程”高校为例[J];图书馆杂志;2007年03期 |
5 |
周涛;陈向东;;基于链接分析的网站评价[J];广西教育学院学报;2008年04期 |
6 |
刘彦祖;;Web of Science数据库中网络链接分析研究论文的定量分析[J];情报探索;2010年02期 |
7 |
刘兵;;基于JavaScript等多链接分析的主题爬虫设计实现[J];许昌学院学报;2010年02期 |
8 |
林明东;;我国省级档案信息网站的链接分析[J];云南档案;2010年07期 |
9 |
吴华香,钟少丹;网络计量学的应用分析[J];图书情报工作;2003年08期 |
10 |
邱均平;陈敬全;段宇锋;;中国大学网站链接分析及网络影响因子探讨[J];中国软科学;2003年06期 |
11 |
董江山,胡吉祥,邱均平;链接分析法及其应用[J];情报科学;2004年09期 |
12 |
陈丽萍;;谈基于链接分析的web社区发现技术[J];科技信息;2009年31期 |
13 |
苏娜;张志强;刘志辉;;基于链接分析的图林博客显著度分析[J];情报资料工作;2010年01期 |
14 |
柳朝阳;用聚类回归模型预测粮食产量[J];计算机应用;1988年06期 |
15 |
阎辉,张学工,李衍达;基于核函数的最大间隔聚类算法[J];清华大学学报(自然科学版);2002年01期 |
16 |
陈定权;Web信息检索技术最新进展[J];现代图书情报技术;2002年02期 |
17 |
颜雪松,蔡之华;一种快速聚类高维数据的算法研究[J];计算机工程;2003年01期 |
18 |
刘志成,文全刚;“K-中心点”聚类算法分析及其实现[J];电脑知识与技术;2005年06期 |
19 |
王元珍,陈涛;基于归类的链接分析技术[J];计算机工程与应用;2005年13期 |
20 |
熊家军,涂静,李庆华;入侵检测聚类中相似性度量的等效性研究[J];计算机工程;2005年07期 |
|