收藏本站
《燕山大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

元搜索引擎结果合成技术的研究

王莎莎  
【摘要】:随着人们对检索效率和准确性的要求不断提高,单一的搜索引擎已经不能满足用户的需要。有时用户为了检索一个内容而要查找多个独立的搜索引擎,为了解决这个问题,元搜索引擎应运而生。元搜索引擎的信息覆盖率比独立搜索引擎大,检索范围广,但是元搜索引擎在检索结果合成方面还不尽人意。本文在综合分析元搜索引擎合成技术的基础上,对如何提高元搜索引擎的检索结果质量进行了深入的研究。 首先,本文对元搜索引擎进行了概述,介绍了元搜索引擎的工作原理及体系结构、分类和特点;详细介绍了元搜索引擎的检索接口技术、成员搜索引擎调度策略、有效信息提取技术、检索结果整合技术等各种实现技术;以及介绍了元搜索引擎的局限性和未来的发展趋势。 其次,在详细讨论了网页去重的相关理论基础及现有网页去重算法优、缺点后,针对元搜索引擎的特点,提出一种基于元搜索引擎的网页去重算法。该算法能有效去除检索结果中的重复网页。 再次,对元搜索引擎结果排序算法进行了研究,提出基于网页质量和用户兴趣的元搜索结果排序算法。该算法改善了基于用户兴趣的结果合并算法,在其基础上引入了对网页质量的度量。 最后,对提出的两种算法进行了仿真实验,以验证两种算法的有效性,从去重效果、正确率、召回率、平均准确率等方面分别分析讨论了所提出算法的性能。
【学位授予单位】:燕山大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP391.3

【相似文献】
中国期刊全文数据库 前10条
1 贺定安;;开发我国网络信息资源的新型搜索工具——分类、主题、自然语言一体化搜索引擎[J];图书情报论坛;2002年04期
2 楼松斋,张惠惠;中文电子期刊的元搜索引擎[J];情报科学;2003年11期
3 马燕,邹显春,包骏杰,李明;一种互联网智能元搜索引擎模型的设计[J];重庆师范大学学报(自然科学版);2004年03期
4 屈长青,李艳芳;元搜索引擎的关键技术[J];现代计算机;2004年05期
5 胡亮,许永诚,高文,胡利平;个性化高效元搜索引擎的设计与实现[J];计算机工程与设计;2005年04期
6 ;来信[J];电子商务世界;2008年01期
7 仇海峰;元搜索引擎[J];中国计算机用户;1997年32期
8 张卫丰;徐宝文;周晓宇;李东;许蕾;;元搜索引擎研究[J];计算机科学;2001年08期
9 张付志,刘明业;一种基于元搜索引擎的数字图书馆系统集成框架[J];北京理工大学学报;2004年08期
10 伏汉英,黄永忠,陈新,杨凯,郭金庚;一种基于Java的元搜索引擎的设计与实现[J];信息工程大学学报;2004年04期
中国重要会议论文全文数据库 前3条
1 梁勇;张文;;网络舆情采集系统的设计[A];2011年全国通信安全学术会议论文集[C];2011年
2 王知津;韩正彪;周鹏;;网络信息移动搜索的结构框架与技术机理探讨[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年
3 李桂华;卢宏亮;石珊珊;张云飞;;团购网站团购项目选择的影响因素研究[A];中国高等院校市场学研究会2011年年会论文集[C];2011年
中国重要报纸全文数据库 前10条
1 壮壮;批量保存网页信息[N];电脑报;2004年
2 东方早报记者 李伟;要名还是要利,这是个问题[N];东方早报;2011年
3 山东 张蕊;“闻香识引擎”[N];中国计算机报;2000年
4 金山软件副总裁 杨桓;着力“三大系统” 构筑网络安全屏障[N];中国电子报;2009年
5 郭京霞;枫叶之都状告百度恶意排名一审败诉[N];中国知识产权报;2007年
6 路人甲;请个专家来贴图[N];电脑报;2005年
7 夏凌;搜索引擎排名纠纷百度胜出[N];中华工商时报;2007年
8 钱鹏;网尽Web页中的好东东[N];电脑报;2004年
9 ITBOY;探索出来的世界[N];电脑报;2004年
10 赵敏超;利用因特网查找信息三步骤[N];中国图书商报;2003年
中国博士学位论文全文数据库 前10条
1 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
2 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
3 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
4 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
5 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
6 王镠璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
7 刘守群;海量网络视频快速检索关键技术研究[D];中国科学技术大学;2010年
8 黄河;农业复杂自适应搜索模型研究及实现[D];中国科学技术大学;2010年
9 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
10 彭涛;面向专业搜索引擎的主题爬行技术研究[D];吉林大学;2007年
中国硕士学位论文全文数据库 前10条
1 于洪波;中文网页自动采集与分类系统设计与实现[D];北京邮电大学;2010年
2 钟鸿鹏;基于时态信息的网页排序系统的研究与实现[D];华南理工大学;2010年
3 张航;主题爬虫的实现及其关键技术研究[D];武汉理工大学;2010年
4 冯明远;深度网络信息爬取关键技术研究与实现[D];浙江大学;2010年
5 邓科;智能搜索中的中文网页分类研究[D];兰州理工大学;2011年
6 党春辉;网页消重和聚类算法在高校搜索引擎中的研究与应用[D];东华大学;2010年
7 马伟瑜;基于改进的PageRank的网页信息可信度评估方法研究[D];河北大学;2011年
8 任斌;基于本体的主动学习主题爬行的研究与实现[D];吉林大学;2010年
9 徐兴智;科技平台撮合系统的设计与实现[D];吉林大学;2010年
10 任兰鹏;基于代表样本的中文网页分类研究[D];山东大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026