收藏本站
《吉林大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

元搜索引擎的研究与实现

王春艳  
【摘要】:元搜索引擎的研究与实现 随着网络上信息量的急剧膨胀,人们借助于搜索引擎这种检索工具,从海量信息中挖掘出有价值的信息。然而,现有的独立搜索引擎也存在着许多问题,例如,资源覆盖范围有限,产生的结果集庞大而复杂,人们无法方便快捷地从中找出自己感兴趣的信息。不同搜索引擎对于同一检索请求,返回的结果也不同,用户需要在不同搜索引擎之间进行切换,才能找到全面的、有价值的信息。建立在独立搜索引擎基础之上的元搜索引擎应运而生,它能够同时调用多个成员搜索引擎,并对返回的结果进行综合处理,呈现给用户。元搜索引擎拥有了更多的信息来源,在一定程度上提高了检索的查全率和查准率,更能满足用户的检索需求,其应用也越来越广泛。 成员搜索引擎往往会返回大量的检索结果,然而,成员搜索引擎之间的差异性,如查询参数的不同、排序方法的不同以及相关函数的差异等,给元搜索引擎的检索结果融合带来了困难,制约了元搜索引擎的功能。本文在对元搜索引擎的关键技术研究与分析的基础上,采用Java语言开发,以Eclipse为主要开发工具,设计并实现了一个简单的元搜索引擎MSE,所做的主要工作如下: 1.对元搜索引擎的工作原理、关键技术进行了介绍,对这些关键技术所涉及到的算法进行了对比分析。 2.对元搜索引擎的成员搜索引擎调度算法进行了深入研究,并对一些典型算法进行了对比分析。在我们开发的系统中,调用了百度、雅虎、搜狗、Google四个搜索引擎进行搜索,为了解决查询参数的差异等问题,通过对各个成员搜索引擎的查询参数的分析,给出了字符编码、查询格式转换的方法,同时采用了并行调用的方式,缩短了检索时间,保证了检索的效率。 3.对元搜索引擎的结果合并技术进行了深入研究,使用简单的死链接检测算法,消除死链接,同时使用Java中的samefile()方法来识别重复URL,消除重复网页;对摘要排序算法进行了改进,试验结果表明,采用该算法在一定程度上提高了检索结果相关度,并且能按照全局相关度,对检索结果进行一致性排序。 本文对系统进行了性能分析,其结果表明MSE在一定程度上提高了检索效率,但是在成员搜索引擎调度、检索结果合并方面仍有待提高,下面给出了元搜索引擎MSE应改进的方向: 1.系统直接调用了四个成员搜索引擎,我们应该在该选择合适的调度策略,让系统可以自行调度性能较好的独立搜索引擎。 2.在检索结果合并方面,应采用更为有效的算法,来消除重复网页;应实现检索结果自动聚类,方便用户查找和浏览相关信息。 3.应提供个性化服务,给用户更为广泛的选择权,结合反馈学习算法,实现符合用户需求的智能信息过滤。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 马燕,邹显春,包骏杰,李明;一种互联网智能元搜索引擎模型的设计[J];重庆师范大学学报(自然科学版);2004年03期
2 屈长青,李艳芳;元搜索引擎的关键技术[J];现代计算机;2004年05期
3 胡亮,许永诚,高文,胡利平;个性化高效元搜索引擎的设计与实现[J];计算机工程与设计;2005年04期
4 ;来信[J];电子商务世界;2008年01期
5 仇海峰;元搜索引擎[J];中国计算机用户;1997年32期
6 张卫丰;徐宝文;周晓宇;李东;许蕾;;元搜索引擎研究[J];计算机科学;2001年08期
7 蔡耿青;搜索引擎——互联网之神[J];教育信息化;2003年09期
8 张付志,刘明业;一种基于元搜索引擎的数字图书馆系统集成框架[J];北京理工大学学报;2004年08期
9 伏汉英,黄永忠,陈新,杨凯,郭金庚;一种基于Java的元搜索引擎的设计与实现[J];信息工程大学学报;2004年04期
10 刘炜,陈俊杰;一种基于Agent的智能元搜索引擎框架[J];计算机工程与应用;2005年03期
11 李明;中文元搜索引擎万纬搜索研究[J];现代图书情报技术;2003年05期
12 龚蛟腾;元搜索引擎研究[J];情报杂志;2004年10期
13 猫女;;一些快速准确搜索资料的技巧[J];网络与信息;2009年02期
14 曾福兴;;主题目录和搜索引擎[J];上海高校图书情报学刊;2000年01期
15 胡誉耀;元搜索引擎的虚拟资源分类[J];情报科学;2004年05期
16 陈伟斌,张鑫;一种基于校园网的元搜索引擎的研究与设计[J];现代计算机;2005年03期
17 刘丽;元搜索引擎结果显示方式研究[J];情报杂志;2005年06期
18 林治;;快捷搜索征服您的想象[J];现代传输;2006年05期
19 薛云,陈俊杰;Internet上有关元搜索引擎的研究与设计[J];电脑开发与应用;2003年04期
20 王雁杰;元搜索引擎的发展悖论及建议[J];情报杂志;2004年07期
中国重要会议论文全文数据库 前10条
1 阳小华;刘振宇;谭敏生;刘杰;左贵启;;元搜索引擎查询结果的合成方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 李慧;张民;宋源清;;网络搜索引擎[A];2009全国计算机网络与通信学术会议论文集[C];2009年
3 孟奇奎;;一种基于数据库和用户反馈信息的元搜索引擎数据库选择算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 余晋;邓志鸿;田敬;唐世渭;;PinkySearch:基于聚类的元搜索引擎[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 吴冷冬;童云海;唐世渭;;面向在线音乐视频的元搜索引擎VMS[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
6 夏小玲;祁博民;廖顺和;;基于Web服务和元搜索引擎的数字图书馆中元数据互操作框架[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
7 陈伟雄;马少平;步建华;;基于元搜索引擎的多关键词检索技术[A];广东省电机工程学会2003-2004年度优秀论文集[C];2005年
8 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
9 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
10 吴远红;徐妙君;范银琛;;元搜索引擎中基于OWA算子的查询结果合成研究[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
中国重要报纸全文数据库 前10条
1 山东 张蕊;“闻香识引擎”[N];中国计算机报;2000年
2 ITBOY;探索出来的世界[N];电脑报;2004年
3 赵敏超;利用因特网查找信息三步骤[N];中国图书商报;2003年
4 王旭;中文智能搜索引擎[N];计算机世界;2001年
5 ;编程沙龙[N];电脑报;2003年
6 PALADIN;算法演义[N];电脑报;2003年
7 PALADIN;算法中的NP问题[N];电脑报;2003年
8 南京 朱罕非;一种实用单片机多字节除法的算法[N];电子报;2004年
9 ;机器人激活算法和程序设计教学[N];中国电脑教育报;2004年
10 李宏;链路聚合解决宽带瓶颈[N];中国计算机报;2001年
中国博士学位论文全文数据库 前10条
1 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
2 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
3 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
4 余金华;电阻层析成像技术应用研究[D];浙江大学;2005年
5 Zhao Peixin;[D];山东大学;2005年
6 唐煜;均匀设计的组合性质及其构作[D];苏州大学;2005年
7 吕翔;波长路由光网络相关问题研究[D];浙江大学;2006年
8 赵裕众;生物序列分析算法的研究及其应用[D];中国科学技术大学;2010年
9 申远;一些求解结构型优化的一阶算法[D];南京大学;2012年
10 徐明;对等网络中的查询路由与重构机制[D];复旦大学;2010年
中国硕士学位论文全文数据库 前10条
1 王春艳;元搜索引擎的研究与实现[D];吉林大学;2011年
2 刘海;建立基于元搜索引擎的语音库查询收集系统[D];淮北师范大学;2011年
3 程宾;基于用户兴趣模型的元搜索引擎的研究[D];山东科技大学;2010年
4 王金栋;元搜索引擎调度策略及结果排序算法的研究[D];燕山大学;2010年
5 王新;一种垂直元搜索引擎的研究[D];西北大学;2010年
6 冯冰洁;后缀树算法在元搜索引擎中的应用[D];暨南大学;2010年
7 张鑫;基于本体论的领域元搜索引擎的研究与设计[D];兰州大学;2010年
8 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
9 刘林;基于语义的元搜索引擎关键技术研究[D];河南工业大学;2010年
10 李亚;元搜索引擎的个性化技术研究[D];燕山大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978