收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

网络链接分析与网站评价研究

段宇锋  
【摘要】: 本论文是国家自然科学基金资助项目“网络信息计量学的理论、方法与实证研究”(批准号:70273032)的组成部分和研究成果之一。 全文共7章,从三个方面对学术型网站的网络链接进行了较为全面的探讨。第一章对目前国内外网络链接领域的研究状况进行了综述;第二、三、四、五章是对网络链接的理论探讨,包括网络链接的研究方法、衡量网络链接的指标体系、网络链接在核心网站测定中的作用以及网站各层的链接特征;第六、七章属于网络链接在科学评价和网站评价中的应用研究,其目的不仅在于探讨网络链接分析在这两个领域的价值,更重要的是检验本研究所建立的方法和运用的指标在实践中的应用。上述各章的主要内容如下: 1、网络链接研究的现状及趋势 本章阐述了网络链接研究的意义、现状、存在的问题及发展趋势。网络链接研究是网络技术进步的产物,也是促使网络在社会生活各领域产生更为深刻影响的现实要求。网络链接研究不仅成为促进网络信息计量学产生和发展的重要动力,而且是探索网络空间结构和进行网络知识挖掘的必然工具,它的突破将极大地提高网络信息检索效率。网络链接分析是一个新兴的研究领域,在理论研究领域目前主要集中在三个方面,即网络链接分析与期刊文献引文分析的异同、网络链接的目的和类型以及网络影响因子的探讨;在应用领域,其研究主要涉及核心网站的确定、网络结构挖掘和知识发现、搜索引擎检索质量的改进和在机构研究能力评价中的应用等。这些方面都是近期研究的重点,虽然,网络链接研究逐步受到各相关领域研究者的关注,并已经取得了一些成果,但总的来说,还没有成熟的理论、方法可供借鉴,应用领域的研究还具有相当的局限性。 2、网络链接研究的方法和工具 特征方法的形成是一个学科和研究领域成熟的重要标志。目前,网络链接研究采用和借鉴的都是传统信息计量学和科学计量学的原理、方法;而且,对这些方法在网络链接领域的适用性还存在较大的争议,远未形成自身独特的方法体系。本章从样本的选择、原始数据的获取、数据的提取和统计以及数据分析四个方面阐述了网络链接的研究方法以及开发和使用的工具,并对每个环节所采用方法的理论基础、具体操作步骤、可能存在的问题和相应的改进措施进行了详尽的描述和分析,希望对以后的研究具有借鉴意义。 3、网站链接的特征研究 本章确立了19个与网络链接相关的指标,以抽样所得的20个商学院网站和20个医学院网站为样本,探讨这些指标所具有的特征。通过这部分的研究,首先,我们发现这些指标数据量的分布不符合正态分布,经过对数转换后,呈现单峰和大致的对称状分布;并且,本研究所确定的101个学术型网站,在这些指标上不存在具有统计意义上的差异;其次,研究证实,网站中指向内部的链接在数量和出现频率上远远高于指向外部的链接,造成这一现象的主要原因可能是网络学术信息资源获取和利用不便,在学术界的认可度不高;再则,本研究发现,在特定主机中,存在大量指向主机外,却在相同域的链接,这部分链接的性质既不同于指向主机自身的链接,也不同于指向域外其它网络资源的链接,在网络链接和网站评价研究中,必须考虑其对研究结果可能造成的影响。 4、核心网站与非核心网站链接的比较研究 核心网站的测定在理论和实践领域都是网络链接的研究热点。这一章里,我们首先详细阐述了如何以网站被链接数和网络影响因子(Web-IF)确定核心网站,并对这两种方法的优劣以及测定结果的一致性进行了分析。结果表明,这两种方法所确定的核心网站基本一致,线性相关分析结果表明,两者显著相关,相关系数为0.75;并指出,在计算Web-IF时应以网站实际可访问到的网页数量作为计算依据;其次,在对核心网站与非核心网站链接特征的对比分析中,由于所选择样本过于同质化,也就是如果以美国所有商学院网站作为研究对象的总体,本研究所选择的样本可能都属于核心网站的范畴,因而两组数据的差异不很显著;第三,研究结果显示,被利用程度高、影响力较大的网站在链接特征上表现为:网站规模平均为964兆字节、页面文件数为4418个、平均每个页面有25个链接,其中指向主机外的链接为6个,指向域外的链接为4个,这些链接指向1871个网站,这些对我们设计网站具有一定的参考价值;第四、对网站被链接数的频数分布研究表明,其分布特点与洛特卡(Lotka)分布非常类似。 5、网站链接的分层研究 网站中不同类型信息的组织和分布是不均衡的。在本章,我们对网站不同层次的功能、文件类型和数量、网络链接的分布特点进行了研究,得到以下结果:第一、网站各层在字节数、文件类型和所拥有的网络链接数量上具有明显的规律性,其变化取决于各层的功能定位;第二、链接密度和页面平均链接数对大量样本而言,具有一定的变化趋势,但个体之间存在较大差异;第三、本研究发现,单纯依靠链接密度和页面平均链接数判定网页功能存在一些缺陷,因此,笔者考虑最好构建能同时反映链接某方面的特性和页面功能的新的量化指标,专门用于判定网页的功能;第四、这部分的研究证实,本研究所确定的核心网站在信息的组织和分布方面比较合理,表明这些网站在建设过程中经过了严谨的规划。 6、链接分析与大学评价研究 本章对网站被链接数和Web-IF在大学评价研究中的作用进行了讨论,并探讨了网站链接各方面的属性与大学综合排名的相关程度,以明确其对提升大学综合排名的贡献率,结果发现:第一、网站影响因子与大学综合排名具有一定的线性相关关系,但网站被链接数与大学综合排名并不具有线性相关关系。这表明,我们利用网站链接特征开展大学综合评价研究必须考虑到网站规模对研究结果所造成的影响;第二、衡量网站链接特征的各指标与大学综合排名的线性相关分析没有发现两者之间具有线性相关关系,这表明,网站链接对提升大学综合排名的贡献率很低;第三、通过分析,我们认为网络在学术研究领域所发挥的效用还不够,它远未成为学术团体和学者开展学术研究和进行学术研讨的主要场所,在提高科研绩效,促进组织和机构的发展方面所起到的作用极其有限,还有待大力开发并提高其功能和效益。 7、中、美学术型网站链接特征的比较研究 通过对中国财经类院校网站与美国商学院网站的对比研究,我们发现两者在网站规模、网站具有的链接数量和网站影响力等方面都存在显著的差异。这些差异不仅表明中国财经类院校的网站在信息含量、信息组织的合理程度以及网站影响力等方面低于美国同类网站,更重要的是,我们通过这个比较研究认识到我国网络资源的建设与美国所存在的巨大差距。笔者认为,为了缩小这种差距,我们必须强化社会的网络意识,将网络信息资源建设作为促进科技进步和社会发展的重要措施,相关部门对此应给与高度重视和积极的引导与支持。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈太洋;;我国大学图书馆网站链接的实证分析——以中国“211工程”高校为例[J];图书馆杂志;2007年03期
2 周涛;陈向东;;基于链接分析的网站评价[J];广西教育学院学报;2008年04期
3 刘彦祖;;Web of Science数据库中网络链接分析研究论文的定量分析[J];情报探索;2010年02期
4 刘兵;;基于JavaScript等多链接分析的主题爬虫设计实现[J];许昌学院学报;2010年02期
5 林明东;;我国省级档案信息网站的链接分析[J];云南档案;2010年07期
6 吴华香,钟少丹;网络计量学的应用分析[J];图书情报工作;2003年08期
7 邱均平;陈敬全;段宇锋;;中国大学网站链接分析及网络影响因子探讨[J];中国软科学;2003年06期
8 董江山,胡吉祥,邱均平;链接分析法及其应用[J];情报科学;2004年09期
9 陈丽萍;;谈基于链接分析的web社区发现技术[J];科技信息;2009年31期
10 苏娜;张志强;刘志辉;;基于链接分析的图林博客显著度分析[J];情报资料工作;2010年01期
11 陈定权;Web信息检索技术最新进展[J];现代图书情报技术;2002年02期
12 杨楠;;基于超链接的镜像页面比较策略研究[J];计算机科学;2007年07期
13 陈向东;;一种新的教育网站评价方法:链接分析[J];中国电化教育;2007年07期
14 李江;;论情报学视角的链接分析(ISLAA)[J];情报资料工作;2008年01期
15 王轶;孙焱;;山西省高校网站链接分析[J];晋图学刊;2011年01期
16 沙勇忠,牛春华;中国信息化优秀企业网站链接分析与网络影响因子测度[J];兰州大学学报(社会科学版);2004年05期
17 李绍华;高文宇;;搜索引擎页面排序算法研究综述[J];计算机应用研究;2007年06期
18 邱均平;李江;任全娥;李晔君;;论博客链接索引的设计[J];情报理论与实践;2007年04期
19 宋丹;林鸿飞;杨志豪;;基于内容计算和链接分析的Web话题跟踪方法[J];情报学报;2007年04期
20 罗淑娴;;搜索引擎对网络信息资源评价的应用分析研究[J];图书馆学刊;2008年01期
中国重要会议论文全文数据库 前10条
1 刘兵;胡学钢;;基于多链接分析的主题爬虫设计实现[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
2 宋丹;林鸿飞;杨志豪;;一种利用链接分析的Web话题跟踪方法[A];第三届学生计算语言学研讨会论文集[C];2006年
3 邹纲;孟遥;于浩;西野文人;;一种基于网站主页信息建立公司名称知识库的方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 吴炜;梁昆;李瑞轩;辜希武;卢正鼎;;一种基于主题相关度的网页排序算法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
5 刘菁菁;林鸿飞;杨志豪;;基于PageRank和锚文本的网页排序研究[A];第三届学生计算语言学研讨会论文集[C];2006年
6 杨宇航;赵铁军;郑德权;于浩;;基于链接分析的重要Blog信息源发现[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 张冉;卡米力毛依丁;;基于论文参考文献引用分析的专业文献查询库[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
8 杨磊;束罡;牛振东;;基于引力模型的链接分析(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 葛先军;李志勇;宋巍巍;;基于网页恶意脚本链接分析的木马检测技术[A];第五届中国测试学术会议论文集[C];2008年
10 刘悦;王斌;杨志峰;张鑫;;Web关键资源发现中的链接分析技术[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 段宇锋;网络链接分析与网站评价研究[D];武汉大学;2004年
2 褚武英;三种石首鱼紧密连锁的α-和β-珠蛋白基因的克隆及其顺式调控元件的分析[D];浙江大学;2006年
3 刘洪波;INTERNET中的信息网络提取分析及Rank相关研究[D];清华大学;2007年
4 江开忠;上下文感知的Web搜索关键技术研究[D];华东师范大学;2008年
5 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
6 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
7 李楠;基于关联数据的知识发现研究[D];中国农业科学院;2012年
8 吴刚;RDF图数据管理的关键技术研究[D];清华大学;2008年
9 徐秀娟;商务智能中的利润挖掘研究[D];吉林大学;2008年
10 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年
中国硕士学位论文全文数据库 前10条
1 郭坤银;基于页面分块和链接分析的Web图片检索研究[D];重庆大学;2009年
2 高文梁;改进的基于历史信息分析的网页排序算法[D];大连理工大学;2009年
3 陈翰生;基于改进HITS算法及位置信息的关键网页信息抽取方法[D];复旦大学;2009年
4 杨鑫;基于链接分析的电信呼叫数据研究与应用[D];北京邮电大学;2009年
5 朱自强;网络信息计量学理论与方法:大学网站网络流量及页面链接分析研究[D];南京理工大学;2005年
6 付克志;基于Web的文本信息检索算法的研究[D];大连理工大学;2006年
7 岳增慧;高校图书馆网络空间链接特征研究[D];曲阜师范大学;2011年
8 沈勇明;复杂网络中的链接预测[D];华南理工大学;2011年
9 张宗宇;社会化网络的链接预测[D];北京邮电大学;2011年
10 补嘉;基于LDA的社交网络链接预测模型研究[D];西南大学;2012年
中国重要报纸全文数据库 前9条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
2 本报记者 侯继勇 刘涓涓 郑小伶 亦有;刘建国逻辑:那五年百度在做什么[N];21世纪经济报道;2005年
3 钱鹏;网尽Web页中的好东东[N];电脑报;2004年
4 希安;微软试水信息检索[N];经济日报;2004年
5 百度网络技术公司 刘建国;从中国人网站看搜索引擎的ASP服务[N];中国计算机报;2000年
6 韩宗树;湖南图书馆 开门办馆 读者至上[N];中国文化报;2006年
7 本报记者 王翌;“搜索”改变信息获取方式[N];计算机世界;2004年
8 Websense中国区高级技术顾问 李智明;反垃圾邮件成为网络安全重要一环[N];中国计算机报;2008年
9 赛迪网 方刚;不只是网站才垂直[N];中国计算机报;2000年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978