收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

分布式网络搜索引擎的研究与实现

张婷  
【摘要】:由于搜索引擎经济的兴起带动了整个互联网经济的复苏,搜索引擎经济也从另一方面向世人展示了互联网仍潜藏着为人所不知的惊天商机,业界开始将更多的目光放在各搜索引擎的性能和流量等方面的关注上。伴随着信息时代而来的信息爆炸,互联网上的信息每天以指数级的速度增长,各行业以及互联网个人用户纷纷借助于搜索引擎技术来处理数据,小到本地文件的搜寻,大至互联网数据的检索。本文针对不同搜索方案的需求,提出了一种易扩展的分布式搜索引擎的构架,并重点对其进行了设计和实现。 论文在详细阐述网络搜索引擎的相关理论和技术的基础上,有针对性地对关键技术进行分析讨论,以实现一个可分布式采集和查询,可以为某一行业以及相关软件系统提供网络数据索引和检索的功能系统为目的。 论文主要工作如下:介绍了目前搜索引擎的研究现状、存在的问题以及发展趋势;阐述了搜索引擎的工作原理以及各部分的主要功能;系统介绍了搜索引擎内核实现的原理和相关实现方法。 为了能高效、便捷地满足用户的信息需求,弥补传统个性化技术的不足,提出基于语义的自适应网页推荐模式,采用语义本体和用户查询倾向机制构建自适应的语义用户模型,并采用语义质心聚类技术来提高推荐的准确率。实验结果表明,与其它推荐方法相比该算法具有更高的推荐准确率和召回率。 在插件机制的基础上,设计实现了一个可扩展,并且可以进行分布式查询的搜索引擎体系结构。每一台索引机器负责特定域名信息的采集和索引,对于存储在不同机器上的网页数据可以进行并行检索。重点阐述了搜索系统框架的实现,在分析系统各模块之间关系的基础上,介绍了各模块的实现原理。 总体上,本文论述了基于插件机制的可分布式查询和采集的完整的搜索引擎的设计方法,并且改进了语义网页推荐模式。经验证,所实现的搜索引擎的架构体系具有良好的实用性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 ;谷歌对决微软争夺搜索引擎市场[J];中国新通信;2008年04期
2 ;寰球传媒[J];现代视听;2010年02期
3 王莹;;网络搜索引擎使用技巧[J];河南科技;2010年14期
4 ;Yahoo!DEC情缘已尽[J];每周电脑报;1998年21期
5 ;IDT推出业界最高性能250MSPS网络搜索引擎[J];电子工程师;2003年08期
6 ;IPv6引爆商机 IDT第四代网络搜索引擎实现三大创新[J];电子测试;2004年10期
7 ;网络搜索引擎在下一代存储交换机中大有作为[J];世界电子元器件;2003年08期
8 梁海滨;王瑜;;科技期刊应高度重视网络搜索引擎的影响和应用[J];编辑之友;2006年04期
9 ;TCAM引擎利用双LA-1接口达到18 Mb[J];电子设计技术;2004年06期
10 袁金萍;本地搜索服务——市场的新商机[J];数码世界;2005年07期
11 ;战国硝烟起,搜索直指专业化[J];信息产业报道;2005年09期
12 ;港湾选用IDT网络搜索引擎[J];世界电子元器件;2005年12期
13 屈辰晨;;搜索引擎:助数字出版驶入快车道?[J];出版参考;2007年21期
14 gary stein;;社交网络和搜索将走向整合[J];中国传媒科技;2009年11期
15 ;赛普拉斯的网络搜索引擎和协处理器[J];电子工程师;2001年11期
16 里萨·博坎;;网络搜索引擎的未来[J];语文新圃;2009年02期
17 ;检阅搜索引擎[J];每周电脑报;1997年38期
18 陈文莉;;目录学的传统与继承——基于网络信息技术的认识[J];图书馆理论与实践;2009年04期
19 丁玲;;网络搜索引擎在高校图书馆工作中的应用研究[J];农业图书情报学刊;2009年12期
20 ;IDT网络搜索引擎加速先进电信计算架构平台信息包处理[J];现代电子技术;2006年07期
中国重要会议论文全文数据库 前10条
1 吴颖;;对网络搜索引擎辅助翻译的反思[A];全国首届翻译硕士(MTI)教育与翻译产业研讨会论文集[C];2009年
2 岑荣伟;刘奕群;茹立云;张敏;马少平;;基于虚拟主题的网络关键资源页面定位技术研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 韩近强;赵静;杨冬青;唐世渭;姚小波;;基于领域知识的网页筛选系统[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
4 王晓峰;刘惟一;;从用户需求到网页集团的模糊变换[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
5 吴倩;杨逍;张兆心;;基于视觉特征的网页信息提取[A];第六届全国信息检索学术会议论文集[C];2010年
6 葛正荣;李婷玉;姚天昉;;汉语情感问题类型分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 罗阳;季铎;张桂平;王莹莹;;面向单一网页的双语资源挖掘方法[A];第六届全国信息检索学术会议论文集[C];2010年
8 张贯虹;乌达巴拉;巩政;;基于向量空间模型的网页文本句子对齐方法研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
9 赵玉芳;张一鸣;;基于网页信息的印象形成的初步研究[A];第十届全国心理学学术大会论文摘要集[C];2005年
10 张阳;李战怀;近藤广幸;;WEB PAGE的自动分类[A];第十六届全国数据库学术会议论文集[C];1999年
中国博士学位论文全文数据库 前10条
1 焦斌星;用于搜索的网页可视化摘要技术研究[D];中国科学技术大学;2012年
2 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
3 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
4 王镠璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
5 刘守群;海量网络视频快速检索关键技术研究[D];中国科学技术大学;2010年
6 黄河;农业复杂自适应搜索模型研究及实现[D];中国科学技术大学;2010年
7 段瑞雪;基于依存关系的用户意图的研究[D];北京邮电大学;2011年
8 涂锟;基于自然语言与记忆再重构的常识推理模型[D];华南理工大学;2010年
9 曹鲁慧;Web个人信息集成问题研究[D];山东大学;2012年
10 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
中国硕士学位论文全文数据库 前10条
1 张婷;分布式网络搜索引擎的研究与实现[D];解放军信息工程大学;2011年
2 史丛;网络搜索引擎的相关技术研究[D];山东科技大学;2011年
3 郭晓刚;个性化网络搜索引擎研究[D];吉林大学;2010年
4 于洪波;中文网页自动采集与分类系统设计与实现[D];北京邮电大学;2010年
5 钟鸿鹏;基于时态信息的网页排序系统的研究与实现[D];华南理工大学;2010年
6 张航;主题爬虫的实现及其关键技术研究[D];武汉理工大学;2010年
7 冯明远;深度网络信息爬取关键技术研究与实现[D];浙江大学;2010年
8 邓科;智能搜索中的中文网页分类研究[D];兰州理工大学;2011年
9 党春辉;网页消重和聚类算法在高校搜索引擎中的研究与应用[D];东华大学;2010年
10 马伟瑜;基于改进的PageRank的网页信息可信度评估方法研究[D];河北大学;2011年
中国重要报纸全文数据库 前10条
1 陆影;网络搜索引擎也要收费了[N];中国信息报;2001年
2 康乐;漫谈搜索引擎技术[N];中国化工报;2002年
3 本报记者 施嘉奇;你也会得“搜索病”吗[N];文汇报;2010年
4 本报记者 刘丽丽;我是机器人[N];计算机世界;2011年
5 康乐;技术与人文的结晶[N];计算机世界;2002年
6 壮壮;批量保存网页信息[N];电脑报;2004年
7 记者 柴丽;刘义权先进事迹在全社会引起热烈反响[N];中国档案报;2009年
8 魏 薇;微软Google正式上演龙虎斗?[N];中国信息报;2004年
9 京 勇;兴奋的布林和佩奇[N];中国企业报;2004年
10 靖红;GoTo.com服务特定消费者[N];国际经贸消息;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978