收藏本站
《南京理工大学》 2002年
收藏 | 手机打开
二维码
手机客户端打开本文

元搜索引擎的关键技术研究及系统实现

郭琰  
【摘要】: 随着网络信息的爆炸性增长,人们在网上查询自己所需要信息的难度变的越来越大。搜索引擎的出现在某种程度上缓解了这个矛盾。但是,由于不同的搜索引擎所采用的算法和搜索范围的不同,返回搜索结果的重复率不到34%,如果要得到相对全面,准确的搜索结果,必须同时采用多个搜索引擎,元搜索引擎是在这样的背景下产生的。 如何使元搜索引擎更加的人性化是将来元搜索引擎的发展方向之一,目前的元搜索引擎中在这方面的工作做的很少。我们认为如何智能的选择成员搜索引擎和如何对返回的结果进行自动分类是使元搜索引擎系统更加人性化的关键技术。 在如何选择元搜索引擎的成员搜索引擎的问题上,我们对比了现有的成员搜索引擎选择方法,并对他们做出了评价,最后提出了在成员搜索引擎选择中还有待于解决的问题。 在对不同搜索引擎返回结果的自动分类上,我们先概括的介绍了文本分类的背景,然后提出一种基于n-Gram自动分类方法,该方法的不但适合于在线实现而且还具有跨语种的特点。 最后,我们设计并实现了一个并行式元搜索引擎。相比于其他的元搜索引擎由于结合了上述的技术,使用起来显得更加的人性化。然后我们对系统的查询时间和查准率进行分析。通过和一般的搜索引擎的对比,我们证明了该系统在查准率上对于一般的搜索引擎而言有着明显的优越性。
【学位授予单位】:南京理工大学
【学位级别】:硕士
【学位授予年份】:2002
【分类号】:TP393.03

【引证文献】
中国期刊全文数据库 前1条
1 管建和;甘剑峰;;基于Lucene全文检索引擎的应用研究与实现[J];计算机工程与设计;2007年02期
中国硕士学位论文全文数据库 前4条
1 蔡勇智;基于SMS的移动搜索系统的设计及其实现技术的研究[D];福州大学;2006年
2 李自强;基于文本挖掘的Web信息检索研究[D];华北电力大学(河北);2007年
3 陈靖;垂直育儿搜索引擎研究[D];西南大学;2010年
4 曾旭;全文检索引擎应用于邮件的设计与实现[D];电子科技大学;2010年
【参考文献】
中国期刊全文数据库 前6条
1 解冲锋,李星;并行式Meta Search系统的设计与实现[J];计算机工程与应用;1999年02期
2 张卫丰;徐宝文;周晓宇;李东;许蕾;;元搜索引擎研究[J];计算机科学;2001年08期
3 张卫丰;徐宝文;周晓宇;许蕾;李东;;Web搜索引擎综述[J];计算机科学;2001年09期
4 邹海山,吴勇,吴月珠,陈阵;中文搜索引擎中的中文信息处理技术[J];计算机应用研究;2000年12期
5 陈华辉;一个中英文全文搜索引擎的设计与实现[J];计算机应用研究;2001年03期
6 蒋晓冬,金宇晖,强庆华;基于改进VSM的大规模真实文档自动分类系统的研究和实现[J];现代计算机;1998年03期
【共引文献】
中国期刊全文数据库 前10条
1 王正;陆余良;刘金红;施凡;;基于Lucene的互联网文献信息检索系统的研究[J];安徽大学学报(自然科学版);2009年05期
2 朱力平,丰国炳;用基于内容的Web图像搜索引擎设计消防电子化道路水源手册[J];安全与环境学报;2004年03期
3 李跃民;王浩;赵生慧;;有词典中文分词算法研究[J];滁州学院学报;2008年03期
4 莫梅琦,何雷,徐一新;利用Meta Search技术建设重点学科导航库[J];大学图书馆学报;2001年05期
5 唐忠;欧旭;;因特网搜索引擎技术原理及发展趋势研究[J];大众科技;2009年01期
6 朱小娟;陈特放;;词频统计中文分词技术的研究[J];仪器仪表用户;2007年03期
7 王坚,赵恒永;专业搜索引擎中文分词算法的实现与研究[J];福建电脑;2005年07期
8 左羽;搜索引擎的原理及技术分析研究[J];福建电脑;2005年08期
9 温艳鸿;;基于lucene的文件搜索引擎的设计与扩展[J];福建电脑;2007年08期
10 巩知乐;张德贤;;文本挖掘理论概述[J];福建电脑;2008年09期
中国重要会议论文全文数据库 前1条
1 柏桂荣;章勇;;基于RSS的用户兴趣模型研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
2 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
3 张智雄;Internet科技信息资源门户网站(STIP)系统的实践研究[D];中国科学院文献情报中心;2000年
4 李四明;基于智能Agent的网上农业信息挖掘研究[D];中国农业大学;2003年
5 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
6 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
7 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
8 易高翔;粗糙集在Web挖掘中的应用研究[D];华中科技大学;2006年
9 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
10 陈浩;Web搜索的用户兴趣与智能优化研究[D];中南大学;2012年
中国硕士学位论文全文数据库 前10条
1 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
2 刘林;基于语义的元搜索引擎关键技术研究[D];河南工业大学;2010年
3 冯晶晶;面向软件测试领域的自动问答系统[D];河南理工大学;2010年
4 毛敏芹;对搜索引擎扩充语义信息功能方法研究[D];华东师范大学;2010年
5 郭瞳康;基于词典的中文分词技术研究[D];哈尔滨理工大学;2010年
6 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
7 沙有闯;基于Web文本挖掘的网络口碑监测系统研究[D];安徽大学;2010年
8 蔡蕊;一种新的搜索引擎分词词典的研究[D];山东大学;2010年
9 孟星;基于Agent的自适应信息检索系统技术研究[D];西安电子科技大学;2009年
10 卢建华;基于Web应用系统的性能测试及工具开发[D];西安电子科技大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 胡慧;互联网的信息检索技术[J];图书与情报;1998年03期
2 陆云;;对基于Java的全文检索工具包lucene的索引研究[J];电脑学习;2007年02期
3 蔡勇智;基于最大匹配分词算法的中文词语粗分模型[J];福建电脑;2005年09期
4 刘敏娜;葛萌;陈娟;;基于Lucene的全文搜索引擎设计与实现[J];福建电脑;2009年05期
5 潘以锋;;基于Lucene的网站全文检索系统的开发[J];广西教育学院学报;2006年05期
6 汪涛;;论基于Java的全文检索实现和索引性能提高[J];湖北民族学院学报(自然科学版);2009年01期
7 李亚飞,刘业政;Web挖掘的体系研究[J];合肥工业大学学报(自然科学版);2004年03期
8 朱涛;;手机搜索渐入佳境[J];互联网天地;2004年12期
9 马哲,姚敏;一种改进的基于PATRICIA树的汉语自动分词词典机制[J];华南理工大学学报(自然科学版);2004年S1期
10 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
中国博士学位论文全文数据库 前4条
1 彭涛;面向专业搜索引擎的主题爬行技术研究[D];吉林大学;2007年
2 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
3 陈竹敏;面向垂直搜索引擎的主题爬行技术研究[D];山东大学;2008年
4 鲍钰;WEB日志挖掘及其应用研究[D];华东师范大学;2010年
中国硕士学位论文全文数据库 前10条
1 贾自艳;中文智能搜索引擎关键技术研究[D];北京工业大学;2001年
2 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
3 赵志荣;个性化搜索引擎的研究、设计与实现[D];四川大学;2002年
4 陈先;智能搜索引擎关键技术研究与实现[D];哈尔滨工程大学;2003年
5 李欣;基于概念检索的智能信息检索技术研究[D];华中师范大学;2004年
6 刘峰;通用中英文专业搜索引擎技术的研究及应用[D];大连理工大学;2004年
7 刘辉;搜索引擎联邦算法设计与系统实现[D];清华大学;2004年
8 刘轶;农村0~3岁儿童母亲社会支持系统研究[D];西北师范大学;2005年
9 林华兵;移动搜索中的查询优化和主题分类策略[D];福州大学;2006年
10 蔡春勇;元搜索引擎的智能化及其设计与实验[D];福州大学;2006年
【二级引证文献】
中国期刊全文数据库 前10条
1 朱学芳;冯曦曦;;面向农业主题搜索引擎设计与实现[J];安徽农业科学;2011年35期
2 李敏;黄凯;;一个多线程全文检索系统的构建[J];长江大学学报(自然科学版)理工卷;2010年03期
3 刘敏娜;葛萌;陈娟;;基于Lucene的全文搜索引擎设计与实现[J];福建电脑;2009年05期
4 周文勤;;使用Heritrix和Lucence的全文检索解决方案[J];甘肃联合大学学报(自然科学版);2012年04期
5 李明宙;罗艳;王宗义;;Lucene全文检索引擎的结构机制与应用方式[J];广西科学院学报;2010年04期
6 裴志松;;基于Lucene的毕业论文相似性检测[J];长春工程学院学报(自然科学版);2013年04期
7 汪涛;;论基于Java的全文检索实现和索引性能提高[J];湖北民族学院学报(自然科学版);2009年01期
8 宋佳;诸云强;刘润达;;一种基于Lucene改进的全文检索工具包[J];计算机工程与应用;2008年04期
9 李靖;文登敏;张润伟;;基于Lucene的全文检索引擎的研究与应用[J];淮阴工学院学报;2008年01期
10 王彬;张计龙;徐迎晓;;整合数据持久化与全文检索的新方法[J];计算机工程;2009年03期
中国重要会议论文全文数据库 前1条
1 李明宙;罗艳;王宗义;;Lucene全文检索引擎的研究及应用[A];广西计算机学会2010年学术年会论文集[C];2010年
中国博士学位论文全文数据库 前1条
1 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
中国硕士学位论文全文数据库 前10条
1 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
2 樊春雷;基于语义分析的糖尿病健康教育系统研究与实现[D];华东理工大学;2011年
3 王兆宇;个性化站内搜索引擎的设计与应用[D];东华大学;2011年
4 马静;基于web的数字化资源全文检索系统的设计与实现[D];西安电子科技大学;2010年
5 吴代文;基于Lucene的二次全文检索系统设计与实现[D];西安电子科技大学;2009年
6 丁士敏;基于Ajax/Lucene的站内搜索技术研究与实现[D];西安电子科技大学;2008年
7 孙华昱;Lucene在医学影像资源检索平台中的应用[D];沈阳工业大学;2011年
8 闻峥;基于Lucene的搜索引擎优化[D];北京交通大学;2011年
9 陈刚;基于行为分析智能推荐购物搜索引擎的设计与实现[D];北京交通大学;2011年
10 迟名;烟草专卖网平台的设计与实现[D];吉林大学;2011年
【二级参考文献】
中国期刊全文数据库 前5条
1 顾春庆,于玉,顾永立,胡运发;汉字全文检索的实现与探讨[J];计算机工程;1998年02期
2 严威,赵政;开发中文搜索引擎汉语处理的关键技术[J];计算机工程;1999年06期
3 刁倩,张惠惠,王永成;Internet上的英文搜索引擎[J];计算机工程;1999年07期
4 都云程,卢献华;中文搜索引擎现状与展望[J];中文信息学报;1999年03期
5 杨文清,黄宜华,张福炎;中文Web文档库全文检索技术研究与实现[J];中文信息学报;1999年04期
【相似文献】
中国期刊全文数据库 前10条
1 马燕,邹显春,包骏杰,李明;一种互联网智能元搜索引擎模型的设计[J];重庆师范大学学报(自然科学版);2004年03期
2 屈长青,李艳芳;元搜索引擎的关键技术[J];现代计算机;2004年05期
3 胡亮,许永诚,高文,胡利平;个性化高效元搜索引擎的设计与实现[J];计算机工程与设计;2005年04期
4 ;来信[J];电子商务世界;2008年01期
5 仇海峰;元搜索引擎[J];中国计算机用户;1997年32期
6 张卫丰;徐宝文;周晓宇;李东;许蕾;;元搜索引擎研究[J];计算机科学;2001年08期
7 蔡耿青;搜索引擎——互联网之神[J];教育信息化;2003年09期
8 张付志,刘明业;一种基于元搜索引擎的数字图书馆系统集成框架[J];北京理工大学学报;2004年08期
9 伏汉英,黄永忠,陈新,杨凯,郭金庚;一种基于Java的元搜索引擎的设计与实现[J];信息工程大学学报;2004年04期
10 刘炜,陈俊杰;一种基于Agent的智能元搜索引擎框架[J];计算机工程与应用;2005年03期
中国重要会议论文全文数据库 前10条
1 阳小华;刘振宇;谭敏生;刘杰;左贵启;;元搜索引擎查询结果的合成方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 李慧;张民;宋源清;;网络搜索引擎[A];2009全国计算机网络与通信学术会议论文集[C];2009年
3 孟奇奎;;一种基于数据库和用户反馈信息的元搜索引擎数据库选择算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 余晋;邓志鸿;田敬;唐世渭;;PinkySearch:基于聚类的元搜索引擎[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 吴冷冬;童云海;唐世渭;;面向在线音乐视频的元搜索引擎VMS[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
6 夏小玲;祁博民;廖顺和;;基于Web服务和元搜索引擎的数字图书馆中元数据互操作框架[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
7 陈伟雄;马少平;步建华;;基于元搜索引擎的多关键词检索技术[A];广东省电机工程学会2003-2004年度优秀论文集[C];2005年
8 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
9 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
10 吴远红;徐妙君;范银琛;;元搜索引擎中基于OWA算子的查询结果合成研究[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
中国重要报纸全文数据库 前10条
1 山东 张蕊;“闻香识引擎”[N];中国计算机报;2000年
2 ITBOY;探索出来的世界[N];电脑报;2004年
3 赵敏超;利用因特网查找信息三步骤[N];中国图书商报;2003年
4 王旭;中文智能搜索引擎[N];计算机世界;2001年
5 彭岩 艾迪明;网络信息“拉取”技术[N];计算机世界;2001年
6 易观网络咨询公司;引航“?”年代[N];中国计算机报;2000年
7 应晓敏 窦文华;他山之石[N];计算机世界;2003年
8 搜索引擎9238;英文搜索四当家[N];中国计算机报;2001年
9 应晓敏 窦文华;条条道路通罗马[N];计算机世界;2003年
10 刘洋;数字时代如何写好英语论文[N];中华读书报;2002年
中国博士学位论文全文数据库 前4条
1 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
2 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
3 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
4 徐明;对等网络中的查询路由与重构机制[D];复旦大学;2010年
中国硕士学位论文全文数据库 前10条
1 王美霞;面向主题的元搜索引擎技术研究与系统实现[D];天津理工大学;2013年
2 李磊;个性化元搜索引擎关键技术的研究[D];内蒙古科技大学;2013年
3 王金栋;元搜索引擎调度策略及结果排序算法的研究[D];燕山大学;2010年
4 王新;一种垂直元搜索引擎的研究[D];西北大学;2010年
5 冯冰洁;后缀树算法在元搜索引擎中的应用[D];暨南大学;2010年
6 张鑫;基于本体论的领域元搜索引擎的研究与设计[D];兰州大学;2010年
7 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
8 刘林;基于语义的元搜索引擎关键技术研究[D];河南工业大学;2010年
9 王春艳;元搜索引擎的研究与实现[D];吉林大学;2011年
10 刘海;建立基于元搜索引擎的语音库查询收集系统[D];淮北师范大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026