收藏本站
《四川大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于PageRank算法的搜索引擎优化策略研究

张巍  
【摘要】:随着网络技术的迅猛发展,WWW 已成为信息发布、交互及获取的主要工具,它涉及新闻、广告、消费、金融、教育、电子商务等许多领域。Web 具有四个特点:庞大性、动态性、异构性、半结构化的数据结构环境。此外,Web还包含丰富和动态的超链接资源。面对Web 这些固有特点,人们要从这些海量的数据中查找数据和信息,使用最多的就是搜索引擎技术。 Web 挖掘包含三个方面的内容:内容挖掘、结构挖掘和使用挖掘,本文主要涉及到其中的Web 结构挖掘。结构挖掘是从WWW 的组织结构、Web 文档结构和链接关系中推导知识。就搜索引擎技术领域来说,可以通过分析一个网页或整个网站链接和被链接的数量、对象,建立Web 自身的链接结构模式,通过分析和研究PageRank、HITS,TSPR 等基于链接结构的搜索结果排名算法,可以指导网站链接结构优化,有组织,有规划地提高网页在搜索结果中的排名,避免盲目处理造成的混乱结果。本文主要针对目前主流的PageRank 算法,集中研究了该算法的形成思路、计算方法,并分析该算法在独立网站、包含索引页面、包含入站链接和出站链接等几种模型下的效果,提出了相应的优化策略。然后概要介绍了java 版PageRank 计算程式的大体思路,并给出了通过本程序验证这些优化策略的实验结果。最后通过总结PageRank 算法的优缺点,引入了Topic Sensitive PageRank,Hilltop 等算法并做了简要介绍。 Web 挖掘是知识时代人们对于从大量信息中获取知识的需要。对于搜索引
【学位授予单位】:四川大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP393.092

【引证文献】
中国期刊全文数据库 前1条
1 王煜;;搜索引擎中网站排名的影响因素[J];中国科技信息;2007年03期
中国硕士学位论文全文数据库 前9条
1 张永强;基于转移概率的PageRank算法研究[D];暨南大学;2009年
2 谢侨;一个基于二次过滤的垂直搜索引擎的设计与实现[D];暨南大学;2008年
3 刘运佳;基于Lucene和Heririx构建搜索引擎的研究和示例实现[D];电子科技大学;2008年
4 吴海明;基于Lucene的搜索引擎技术的研究与改进[D];暨南大学;2006年
5 张永华;基于用户兴趣的P2P内容搜索机制的研究和实现[D];上海交通大学;2007年
6 王星辉;搜索引擎设计分析与查询改进[D];电子科技大学;2007年
7 胡晓博;面向特定领域的专业搜索引擎的架构与实现方法[D];哈尔滨工程大学;2007年
8 冯振明;分块式PageRank收敛算法及其改进[D];河海大学;2006年
9 肖佳;基于Agent的信息推送技术的研究与应用[D];苏州大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 阎磊;马宏琳;;FTP文件遍历方法研究与应用[J];电脑编程技巧与维护;2008年16期
2 刘杰;谈个人数字图书馆[J];甘肃科技;2004年04期
3 李彦,贾爱军,占向辉,李翔龙;面向创新设计的多层次Web信息检索研究[J];工程设计学报;2005年03期
4 胡双双;秦杰;;搜索引擎技术及其发展趋势[J];福建电脑;2008年06期
5 尚冬娟;张敏;;信息过滤系统中的混合式过滤算法[J];重庆工学院学报(自然科学版);2008年01期
6 阎磊;马宏琳;;基于图搜索的FTP文件遍历方法研究[J];福建电脑;2008年11期
7 阎磊;马宏琳;;BLOB数据存储技术在文件搜索引擎中的应用[J];福建电脑;2007年01期
8 孟祥增;;基于内容的图像网络教学资源检索研究[J];中国远程教育;2008年04期
9 孟祥增;;多媒体网络教学资源的内容特征提取与搜索研究[J];电化教育研究;2007年12期
10 孙静;赵恒永;;搜索引擎网页快照的安全性研究[J];福建电脑;2007年11期
中国重要会议论文全文数据库 前5条
1 王虎;王潜平;;对整词二分自动分词机制的改进[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
2 吐尔地·托合提;维尼拉·木沙江;艾斯卡尔·艾木都拉;;基于Web的民文信息检索中维、哈、柯文关键词的预处理[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
3 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
4 吐尔地·托合提;维尼拉·木沙江;艾斯卡尔·艾木都拉;;维、哈、柯全文搜索引擎中查询处理研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 张乃岳;张学燕;;基于个体词语相似度的定制化动态信息检索[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前5条
1 文坤梅;基于本体知识库推理的语义搜索研究[D];华中科技大学;2007年
2 陈竹敏;面向垂直搜索引擎的主题爬行技术研究[D];山东大学;2008年
3 王辉;基于质心具有增量性质的主题爬行[D];吉林大学;2007年
4 南凯;面向关系型数据共享的数据网格中间件研究[D];中国科学院研究生院(计算技术研究所);2006年
5 张宏斌;信息获取中的两类不确定问题研究[D];华中科技大学;2004年
中国硕士学位论文全文数据库 前10条
1 陈琳;基于搜索引擎的问答系统若干关键技术研究与实现[D];天津大学;2008年
2 张引琼;基于语义Web的智能作物信息检索系统的分析与研究[D];湖南农业大学;2008年
3 杨光宇;全文检索系统Lucene的分析与扩展[D];吉林大学;2009年
4 卢苇;基于双语翻译搜索引擎的智能用户接口的研究[D];武汉理工大学;2009年
5 乔卫;基于领域本体的XML语义信息抽取的研究与实现[D];武汉理工大学;2009年
6 肖卓磊;基于Ajax技术的搜索引擎研究[D];武汉理工大学;2009年
7 段建国;基于双语翻译的个性化搜索引擎的研究与设计[D];武汉理工大学;2009年
8 苏碧;基于元搜索的双语智能翻译搜索引擎的研究[D];武汉理工大学;2009年
9 赵静;基于PageRank的MBA教育资源搜索引擎研究[D];大连海事大学;2009年
10 原佳丽;网络多媒体教育资源数据库检索研究[D];山东师范大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 雷鸣,王建勇,赵江华,单松巍,陈葆珏;第三代搜索引擎与天网二期[J];北京大学学报(自然科学版);2001年05期
2 李子臣;Google的成功对网络信息界的启示[J];中国传媒科技;2003年08期
3 李粤;安捷;李星;;排序融合算法在校园网搜索引擎中的应用[J];大连理工大学学报;2005年S1期
4 刘世涛;;简析搜索引擎中网络爬虫的搜索策略[J];阜阳师范学院学报(自然科学版);2006年03期
5 陈燕娜,邵志清;基于全文搜索的中文搜索引擎设计技术[J];计算机工程与应用;2002年17期
6 赵仲孟,袁薇,何世丽,沈钧毅;个性化搜索引擎中用户模型智能调整算法的研究[J];计算机工程与应用;2005年24期
7 汪涛,樊孝忠;主题爬虫的设计与实现[J];计算机应用;2004年S1期
8 葛嘉佳;网络个性化信息服务综述[J];计算机时代;2004年05期
9 张汛涞;搜索引擎的设计剖析[J];计算机工程与科学;2002年04期
10 陈桂林,王永成,韩客松,王刚;一种改进的快速分词算法[J];计算机研究与发展;2000年04期
中国硕士学位论文全文数据库 前10条
1 王晓伟;垂直搜索引擎若干关键技术的研究[D];浙江大学;2007年
2 王强;面向专业主题的网页分类算法研究[D];国防科学技术大学;2005年
3 何世林;基于Java技术的搜索引擎研究与实现[D];西南交通大学;2006年
4 贺胜;面向现代汉语文本处理的全文检索、自动分词通用系统[D];南京师范大学;2006年
5 张晓卫;Web全文信息检索系统的研究与实现[D];苏州大学;2006年
6 张会鹏;中文词法分析技术的研究与实现[D];哈尔滨工业大学;2006年
7 刘妮娜;Web数据挖掘和个性化搜索引擎研究[D];浙江大学;2005年
8 何华;搜索引擎中的数据存储问题研究[D];浙江大学;2005年
9 刘兴宇;基于倒排索引的全文检索技术研究[D];华中科技大学;2004年
10 张校乾;基于Lucene的全文检索系统的研究与应用[D];大连理工大学;2005年
【二级引证文献】
中国期刊全文数据库 前1条
1 杨丽娜;周浩;邹霞;;Agent信息推送技术应用于网络自主学习的设计[J];中国电化教育;2008年09期
中国硕士学位论文全文数据库 前4条
1 李广丽;垂直搜索引擎的研究与设计[D];华东交通大学;2008年
2 赵旭;搜索引擎关键技术研究及性能优化[D];江南大学;2008年
3 邱俊;基于多Agent系统的光纤瓦斯传感监测研究[D];武汉理工大学;2008年
4 侯锐;基于TSE的特定领域搜索引擎研究及实现[D];东北师范大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 于国富;;小心!搜索引擎惹麻烦[J];电脑爱好者;2006年13期
2 于国富;;超链接以案说法[J];中国计算机用户;2006年21期
3 makao;要用就用既快又准的搜索引擎[J];电脑应用文萃;2005年11期
4 杨涛;搜索引擎涉及的知识产权问题[J];情报科学;2002年05期
5 刘畅;搜索引擎的Toolbar之争[J];情报科学;2005年03期
6 苏坤,夏旭;搜索引擎分类研究的现状与发展[J];图书馆论坛;2005年01期
7 范新宇;搜索引擎渐入佳境[J];微电脑世界;2000年46期
8 卢亮;搜索引擎暗规则全攻略[J];中国教育网络;2005年07期
9 鲁世才;巧用搜索引擎[J];师范教育;2004年06期
10 金颖云;量体裁衣选搜索[J];电脑应用文萃;2005年02期
中国重要会议论文全文数据库 前10条
1 宋岩;;搜索引擎中的人工智能技术及展望[A];’2004计算机应用技术交流会议论文集[C];2004年
2 吴东辰;;比较国内外几种主要的搜索引擎[A];福建省图书馆学会2005年学术年会论文集[C];2005年
3 陈哲;倪俊峰;;搜索引擎原理概述及其在星空黄页网站中的应用[A];2004年度中国索引学会年会暨学术讨论会论文集[C];2004年
4 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年
5 霍红卫;江裕民;;改进Web结构挖掘算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
6 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
7 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
8 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
9 贾彦国;李培德;;Web检索结果聚类算法的改进[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
10 陈沛;;搜索的未来[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国重要报纸全文数据库 前10条
1 王眉 陈力丹;新型传媒搜索引擎职业操守的缺失及应对[N];学习时报;2008年
2 实习生 杨海鹏;2008中国搜索引擎市场突破50亿元[N];中国新闻出版报;2009年
3 本报记者 朱杰;搜索引擎应用性能分析报告[N];中国计算机报;2009年
4 夏言;全球搜索引擎营销大会四月在厦门举行[N];国际商报;2009年
5 本报记者 张韬;中国搜索引擎用户规模达2.03亿[N];上海证券报;2009年
6 曾正乐;搜索引擎为啥那么热[N];经济日报;2005年
7 管克江;目标在搜索引擎之外[N];人民日报;2009年
8 FN记者 柳立;我国搜索引擎市场竞争格局初步确定[N];金融时报;2005年
9 桅子花;搜索引擎服务网站整治低俗之风见成效[N];中华新闻报;2009年
10 商报记者 金朝力;搜索引擎突围中小企业市场[N];北京商报;2009年
中国博士学位论文全文数据库 前10条
1 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
2 张伟;基于WWW的聚类引擎研究[D];重庆大学;2003年
3 杜亚军;搜索引擎智能行为的研究及实现[D];西南交通大学;2005年
4 徐文贤;因特网矿业信息资源及其利用研究[D];中南大学;2001年
5 乔林;基于多关键词检索的企业竞争情报搜集方法研究[D];中国科学技术大学;2006年
6 王德吉;复杂环境下自适应智能决策支持系统研究[D];中国科学技术大学;2007年
7 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
8 廖小飞;主动网络在移动IPv6、无线网络、移动代理环境中的协议与机制研究[D];中国科学技术大学;2006年
9 吴国民;海量多媒体数字水印技术研究[D];浙江大学;2007年
10 张智雄;Internet科技信息资源门户网站(STIP)系统的实践研究[D];中国科学院文献情报中心;2000年
中国硕士学位论文全文数据库 前10条
1 张巍;基于PageRank算法的搜索引擎优化策略研究[D];四川大学;2005年
2 侯震宇;主题型搜索引擎的研究与实现[D];中国科学院研究生院(文献情报中心);2003年
3 王亮;搜索引擎及其相关性排序研究[D];武汉大学;2004年
4 乔冬梅;搜索引擎现状与发展研究[D];郑州大学;2002年
5 朱金涛;基于超链接搜索策略网络爬行器的设计与实现[D];吉林大学;2007年
6 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年
7 张程;基于智能Agent的搜索引擎研究[D];重庆大学;2002年
8 王琰;搜索引擎营销研究及“ED”公司搜索引擎营销实施[D];电子科技大学;2004年
9 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年
10 李建平;智能化WEB信息搜索引擎的研究与实现[D];大庆石油学院;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026