收藏本站
《吉林大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

元搜索引擎的研究与实现

王春艳  
【摘要】:元搜索引擎的研究与实现 随着网络上信息量的急剧膨胀,人们借助于搜索引擎这种检索工具,从海量信息中挖掘出有价值的信息。然而,现有的独立搜索引擎也存在着许多问题,例如,资源覆盖范围有限,产生的结果集庞大而复杂,人们无法方便快捷地从中找出自己感兴趣的信息。不同搜索引擎对于同一检索请求,返回的结果也不同,用户需要在不同搜索引擎之间进行切换,才能找到全面的、有价值的信息。建立在独立搜索引擎基础之上的元搜索引擎应运而生,它能够同时调用多个成员搜索引擎,并对返回的结果进行综合处理,呈现给用户。元搜索引擎拥有了更多的信息来源,在一定程度上提高了检索的查全率和查准率,更能满足用户的检索需求,其应用也越来越广泛。 成员搜索引擎往往会返回大量的检索结果,然而,成员搜索引擎之间的差异性,如查询参数的不同、排序方法的不同以及相关函数的差异等,给元搜索引擎的检索结果融合带来了困难,制约了元搜索引擎的功能。本文在对元搜索引擎的关键技术研究与分析的基础上,采用Java语言开发,以Eclipse为主要开发工具,设计并实现了一个简单的元搜索引擎MSE,所做的主要工作如下: 1.对元搜索引擎的工作原理、关键技术进行了介绍,对这些关键技术所涉及到的算法进行了对比分析。 2.对元搜索引擎的成员搜索引擎调度算法进行了深入研究,并对一些典型算法进行了对比分析。在我们开发的系统中,调用了百度、雅虎、搜狗、Google四个搜索引擎进行搜索,为了解决查询参数的差异等问题,通过对各个成员搜索引擎的查询参数的分析,给出了字符编码、查询格式转换的方法,同时采用了并行调用的方式,缩短了检索时间,保证了检索的效率。 3.对元搜索引擎的结果合并技术进行了深入研究,使用简单的死链接检测算法,消除死链接,同时使用Java中的samefile()方法来识别重复URL,消除重复网页;对摘要排序算法进行了改进,试验结果表明,采用该算法在一定程度上提高了检索结果相关度,并且能按照全局相关度,对检索结果进行一致性排序。 本文对系统进行了性能分析,其结果表明MSE在一定程度上提高了检索效率,但是在成员搜索引擎调度、检索结果合并方面仍有待提高,下面给出了元搜索引擎MSE应改进的方向: 1.系统直接调用了四个成员搜索引擎,我们应该在该选择合适的调度策略,让系统可以自行调度性能较好的独立搜索引擎。 2.在检索结果合并方面,应采用更为有效的算法,来消除重复网页;应实现检索结果自动聚类,方便用户查找和浏览相关信息。 3.应提供个性化服务,给用户更为广泛的选择权,结合反馈学习算法,实现符合用户需求的智能信息过滤。
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP391.3

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 张强弓,喻国宝,廖湖声,隋树林;一种元搜索引擎的查询结果处理模型[J];华南理工大学学报(自然科学版);2004年S1期
2 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期
3 彭洪汇;林作铨;;Internet上的搜索引擎和元搜索引擎[J];计算机科学;2002年09期
4 张廷华;Web元搜索引擎的改进[J];计算机应用;2002年02期
5 徐莹;;搜索引擎技术及其发展前瞻[J];科技情报开发与经济;2005年24期
6 阳小华,刘振宇,谭敏生,刘杰,张敏捷;元搜索引擎系统合成算法的约束条件[J];软件学报;2002年07期
7 种梅;刘方爱;;元搜索引擎中的成员选择和结果合并策略研究[J];计算机工程与设计;2007年21期
8 王艳芬;杨东东;王琼;;基于本体的元搜索引擎的设计与实现[J];计算机工程与设计;2008年13期
9 任洪平;;中文元搜索引擎成员搜索引擎的选择策略研究[J];图书馆学研究;2009年01期
10 张卫丰,徐宝文,周晓宇,许蕾,李东;元搜索引擎结果生成技术研究[J];小型微型计算机系统;2003年01期
【共引文献】
中国期刊全文数据库 前10条
1 刘金红,夏阳,陆余良;基于Ontology的网络元数据抽取系统的研究与实现[J];安徽电子信息职业技术学院学报;2004年Z1期
2 姜晓刚;;农村图书馆检索系统研究[J];安徽农业科学;2010年13期
3 李红梅;丁振国;周水生;周利华;;元搜索引擎结果合成算法[J];北京邮电大学学报;2008年05期
4 周燕;网络信息资源组织研究[J];图书与情报;2003年01期
5 金玮;张克君;杨炳儒;;一种高效挖掘关联规则的算法研究[J];北京工商大学学报(自然科学版);2006年06期
6 唐培丽,王树明,胡明;基于语义的汉语文献主题词提取算法研究[J];吉林大学学报(信息科学版);2005年05期
7 原福永,李莉,李红岩;智能信息检索的设计与研究[J];燕山大学学报;2005年04期
8 王淑敬;;基于Web的个性化信息检索技术研究[J];电脑编程技巧与维护;2010年12期
9 王树锋,张永奎;交叉语言信息检索研究[J];电脑开发与应用;2001年11期
10 殷妮哿;;Internet中的多媒体快速查询[J];电脑开发与应用;2009年09期
中国重要会议论文全文数据库 前10条
1 王志强;;网络信息化语境下构建现代化图书馆所面临的机遇与应对的措施[A];河北省首届社会科学学术年会论文专辑[C];2007年
2 栾悉道;谢毓湘;文军;吴玲达;;基于知识库的主动式专题搜索引擎[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 汤志伟;王菁;;面向公众的电子政务个性化信息服务体系的构建[A];中国信息经济学会2007年学术年会论文集[C];2007年
4 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
5 李雪竹;周国祥;;基于本体的语义网技术在信息检索中的研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
6 曹玮祺;梁华瑞;朱雷;李涓子;王克宏;;基于半结构化信息模型的信息检索[A];第六届全国计算机应用联合学术会议论文集[C];2002年
7 毛颖;周源远;王继成;;信息过滤技术研究[A];第一届学生计算语言学研讨会论文集[C];2002年
8 邓志鸿;张铭;陈捷;杨冬青;唐世渭;;基于本体的Web信息检索模型初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
9 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
10 许龙飞;陈小宁;;具有模糊语义的Web信息资源获取技术研究与实现[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
中国博士学位论文全文数据库 前10条
1 何因;排序学习中基于直接优化信息检索评价准则算法的理论分析[D];中国科学技术大学;2010年
2 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年
3 卢克斌;炼钢—连铸生产计划与调度的优化方法研究及应用[D];东北大学;2010年
4 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年
5 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
6 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
7 杨震;个性化信息获取方法的研究[D];大连理工大学;2004年
8 吕凝;基于内容的视频数据库多模式检索方法研究[D];吉林大学;2005年
9 刘丽兰;制造网格及其基于QoS的资源管理系统研究[D];上海大学;2004年
10 温浩宇;制造网格若干关键技术研究[D];西安电子科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 程宾;基于用户兴趣模型的元搜索引擎的研究[D];山东科技大学;2010年
2 岳广飞;基于二次搜索的搜索引擎技术研究[D];山东科技大学;2010年
3 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
4 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
5 刘林;基于语义的元搜索引擎关键技术研究[D];河南工业大学;2010年
6 李元乾;基于移动搜索用户关联的信息检索研究[D];北京交通大学;2010年
7 周月红;基于Lucene的站内搜索引擎的设计与开发[D];华东理工大学;2011年
8 周晓红;基于内容与链接的页面价值算法研究[D];电子科技大学;2010年
9 史炜;个性化搜索引擎的研究与设计[D];电子科技大学;2010年
10 沙有闯;基于Web文本挖掘的网络口碑监测系统研究[D];安徽大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 陈大平;集成搜索引擎与元搜索引擎比较研究[J];大学图书情报学刊;2005年01期
3 陈伟雄,马少平,步建华;基于元搜索引擎的多关键词检索技术[J];计算机工程与应用;2004年24期
4 钱功伟;倪林;田甜;曹荣;;带聚类处理的元搜索引擎的设计与实现[J];计算机工程与应用;2007年22期
5 邹涛;王继成;杨文清;张福炎;;文本信息检索技术[J];计算机科学;1999年09期
6 朱茂盛,王斌,程学旗;元搜索引擎及其实现[J];计算机工程;2002年11期
7 曹二堂;刘玉林;;一种基于语义理解的元搜索引擎的研究[J];计算机工程;2006年07期
8 丁秀锋;浅析搜索引擎的原理和发展趋势[J];内江科技;2005年02期
9 李广建,黄崑;元搜索引擎及其主要技术[J];情报科学;2002年02期
10 郭少友;元搜索引擎的原理与设计[J];情报科学;2005年02期
中国硕士学位论文全文数据库 前3条
1 吕传宇;答疑系统中专题式智能型元搜索引擎的研究[D];重庆大学;2004年
2 洪颖;面向化工领域的智能元搜索引擎系统的研究与设计[D];北京化工大学;2004年
3 陈默;基于神经网络的元搜索引擎[D];浙江大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 马燕,邹显春,包骏杰,李明;一种互联网智能元搜索引擎模型的设计[J];重庆师范大学学报(自然科学版);2004年03期
2 屈长青,李艳芳;元搜索引擎的关键技术[J];现代计算机;2004年05期
3 胡亮,许永诚,高文,胡利平;个性化高效元搜索引擎的设计与实现[J];计算机工程与设计;2005年04期
4 ;来信[J];电子商务世界;2008年01期
5 仇海峰;元搜索引擎[J];中国计算机用户;1997年32期
6 张卫丰;徐宝文;周晓宇;李东;许蕾;;元搜索引擎研究[J];计算机科学;2001年08期
7 蔡耿青;搜索引擎——互联网之神[J];教育信息化;2003年09期
8 张付志,刘明业;一种基于元搜索引擎的数字图书馆系统集成框架[J];北京理工大学学报;2004年08期
9 伏汉英,黄永忠,陈新,杨凯,郭金庚;一种基于Java的元搜索引擎的设计与实现[J];信息工程大学学报;2004年04期
10 刘炜,陈俊杰;一种基于Agent的智能元搜索引擎框架[J];计算机工程与应用;2005年03期
中国重要会议论文全文数据库 前10条
1 阳小华;刘振宇;谭敏生;刘杰;左贵启;;元搜索引擎查询结果的合成方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 李慧;张民;宋源清;;网络搜索引擎[A];2009全国计算机网络与通信学术会议论文集[C];2009年
3 孟奇奎;;一种基于数据库和用户反馈信息的元搜索引擎数据库选择算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 余晋;邓志鸿;田敬;唐世渭;;PinkySearch:基于聚类的元搜索引擎[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 吴冷冬;童云海;唐世渭;;面向在线音乐视频的元搜索引擎VMS[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
6 夏小玲;祁博民;廖顺和;;基于Web服务和元搜索引擎的数字图书馆中元数据互操作框架[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
7 陈伟雄;马少平;步建华;;基于元搜索引擎的多关键词检索技术[A];广东省电机工程学会2003-2004年度优秀论文集[C];2005年
8 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
9 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
10 吴远红;徐妙君;范银琛;;元搜索引擎中基于OWA算子的查询结果合成研究[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
中国重要报纸全文数据库 前10条
1 山东 张蕊;“闻香识引擎”[N];中国计算机报;2000年
2 ITBOY;探索出来的世界[N];电脑报;2004年
3 赵敏超;利用因特网查找信息三步骤[N];中国图书商报;2003年
4 王旭;中文智能搜索引擎[N];计算机世界;2001年
5 ;编程沙龙[N];电脑报;2003年
6 PALADIN;算法演义[N];电脑报;2003年
7 PALADIN;算法中的NP问题[N];电脑报;2003年
8 南京 朱罕非;一种实用单片机多字节除法的算法[N];电子报;2004年
9 ;机器人激活算法和程序设计教学[N];中国电脑教育报;2004年
10 李宏;链路聚合解决宽带瓶颈[N];中国计算机报;2001年
中国博士学位论文全文数据库 前10条
1 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
2 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
3 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
4 余金华;电阻层析成像技术应用研究[D];浙江大学;2005年
5 Zhao Peixin;[D];山东大学;2005年
6 唐煜;均匀设计的组合性质及其构作[D];苏州大学;2005年
7 吕翔;波长路由光网络相关问题研究[D];浙江大学;2006年
8 赵裕众;生物序列分析算法的研究及其应用[D];中国科学技术大学;2010年
9 申远;一些求解结构型优化的一阶算法[D];南京大学;2012年
10 徐明;对等网络中的查询路由与重构机制[D];复旦大学;2010年
中国硕士学位论文全文数据库 前10条
1 王春艳;元搜索引擎的研究与实现[D];吉林大学;2011年
2 刘海;建立基于元搜索引擎的语音库查询收集系统[D];淮北师范大学;2011年
3 程宾;基于用户兴趣模型的元搜索引擎的研究[D];山东科技大学;2010年
4 王金栋;元搜索引擎调度策略及结果排序算法的研究[D];燕山大学;2010年
5 王新;一种垂直元搜索引擎的研究[D];西北大学;2010年
6 冯冰洁;后缀树算法在元搜索引擎中的应用[D];暨南大学;2010年
7 张鑫;基于本体论的领域元搜索引擎的研究与设计[D];兰州大学;2010年
8 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
9 刘林;基于语义的元搜索引擎关键技术研究[D];河南工业大学;2010年
10 李亚;元搜索引擎的个性化技术研究[D];燕山大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026