收藏本站
《西安电子科技大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

智能元搜索引擎关键技术研究

李红梅  
【摘要】: 现有的搜索引擎存在覆盖率低和查准率低的缺陷,无法充分满足用户对信息的快速性与有效性要求。元搜索引擎通过调用多个搜索引擎来实现搜索,能较好解决现有搜索引擎的缺陷,但仍然存在智能化程度低、搜索结果的易用性差、无法满足个性化需求等问题。 本文系统综述了智能元搜索引擎技术的研究现状和发展趋势,设计了一个基于Multi-Agent的智能元搜索引擎系统结构模型,并对其中的关键技术进行了研究。数据挖掘能够提取数据中隐含的知识,Web数据挖掘技术应用于搜索引擎中,为Web信息的利用提出了新的解决方案。Agent技术的发展日趋成熟,可有效应用于用户个性化智能信息检索中。因此,Web数据挖掘技术、智能Agent技术与元搜索引擎技术相融合,可提高元搜索引擎的智能化水平,使元搜索引擎技术上升到一个新的高度。本文的主要创新性成果如下所述: 1.在元搜索引擎中吸收了聚类搜索引擎和个性化检索的关键元素,提出了一个基于Multi-Agent的智能元搜索引擎系统结构模型。采用移动Agent和常驻Agent相结合的搜索机制使系统具有更强的适应性,利用并行约简算法实现了常驻Agent对搜索结果的动态合并,可有效避免在结果合成Agent处产生瓶颈。给出了用户个性化模式的表示机制和更新机制,运用个性化检索和聚类浏览相结合的检索方式既能满足用户的个性化要求,提高用户查询的查准率,又能实现对搜索结果的结构化组织,便于用户快速定位有效信息。 2.提出了一种基于虚拟语言模型的成员搜索引擎选择算法。采用将成员搜索引擎数据库与概念相关联的技术,通过静态学习得到数据库与各个概念之间的相关度,并建立数据库的特征描述。对于用户查询,先将其映射到相关概念,然后利用虚拟语言模型计算查询与成员搜索引擎数据库之间的相关性,结合用户对搜索引擎的偏好度实现个性化的成员搜索引擎调度策略。本算法可以弥补Web信息检索中短查询存在的问题,同时提高数据库选择的速度。实验结果表明该算法在搜索结果的查询精度上比采用CORI算法有明显的提高。 3.针对结果合成算法中搜索引擎性能不均衡带来的问题,提出了一种基于群决策的合成算法。对搜索结果的排序位置和文本信息进行规范化处理得到文档的相关分值,平衡搜索引擎之间的差异。利用搜索引擎的性能评价,提出改进的影子文档方法估算非相关文档的分值。考虑成员搜索引擎对用户查询意图的相关程度因素,引入群决策思想实现对搜索结果的排序,将与用户查询意图密切相关的结果排在搜索结果的前面,从而提高查准率。该算法充分利用搜索结果的信息,计算简单、易于实现。实验结果表明与成员搜索引擎相比,其平均相关性有明显提高,并且优于Round-robin、CombSum和CombMNZ三种合成算法。 4.为了获得明确的聚类主题,提出了一种基于概念分组的Web搜索结果聚类算法。对概念分组算法进行了改进,突破了其对查询特征项的限制,利用特征词的同现文档频率来建立概念分组,进而挖掘Web搜索结果之间的语义关联,产生对查询主题的概念描述,实现对搜索结果的聚类。类别标签的选择综合考虑了特征词在类内和文档集中的重要性,使得标签具有较强的文档区分性。算法中对特征词选择进行了优化,保证了产生的类别标签具有明确的含义;通过对搜索结果的语义挖掘,实现了对Web搜索结果的主题发现,同时,具有对同义词的扩展能力。该算法具有较低的时间复杂度,能够满足实时的、语义的、重叠聚类的要求。实验结果表明该算法聚类性能较好,明显优于K-means聚类算法,并且具有较强的自适应性。与中文聚类搜索引擎比比猫相比,在聚类质量和类别标签上都与之相近,但能够产生含义更为明确的类别标签。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 屈长青,李艳芳;元搜索引擎的关键技术[J];现代计算机;2004年05期
2 陈伟斌,张鑫;一种基于校园网的元搜索引擎的研究与设计[J];现代计算机;2005年03期
3 刘丽;元搜索引擎结果显示方式研究[J];情报杂志;2005年06期
4 楼松斋,张惠惠;中文电子期刊的元搜索引擎[J];情报科学;2003年11期
5 薛云,陈俊杰;Internet上有关元搜索引擎的研究与设计[J];电脑开发与应用;2003年04期
6 马燕,邹显春,包骏杰,李明;一种互联网智能元搜索引擎模型的设计[J];重庆师范大学学报(自然科学版);2004年03期
7 胡亮,许永诚,高文,胡利平;个性化高效元搜索引擎的设计与实现[J];计算机工程与设计;2005年04期
8 ;来信[J];电子商务世界;2008年01期
9 仇海峰;元搜索引擎[J];中国计算机用户;1997年32期
10 张卫丰;徐宝文;周晓宇;李东;许蕾;;元搜索引擎研究[J];计算机科学;2001年08期
11 蔡耿青;搜索引擎——互联网之神[J];教育信息化;2003年09期
12 张付志,刘明业;一种基于元搜索引擎的数字图书馆系统集成框架[J];北京理工大学学报;2004年08期
13 伏汉英,黄永忠,陈新,杨凯,郭金庚;一种基于Java的元搜索引擎的设计与实现[J];信息工程大学学报;2004年04期
14 李明;中文元搜索引擎万纬搜索研究[J];现代图书情报技术;2003年05期
15 龚蛟腾;元搜索引擎研究[J];情报杂志;2004年10期
16 猫女;;一些快速准确搜索资料的技巧[J];网络与信息;2009年02期
17 曾福兴;;主题目录和搜索引擎[J];上海高校图书情报学刊;2000年01期
18 彭喜化,张林,余建桥;基于Agent的元搜索引擎结果优化技术[J];计算机应用;2003年12期
19 胡誉耀;元搜索引擎的虚拟资源分类[J];情报科学;2004年05期
20 林治;;快捷搜索征服您的想象[J];现代传输;2006年05期
中国重要会议论文全文数据库 前10条
1 阳小华;刘振宇;谭敏生;刘杰;左贵启;;元搜索引擎查询结果的合成方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 余晋;邓志鸿;田敬;唐世渭;;PinkySearch:基于聚类的元搜索引擎[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
3 李慧;张民;宋源清;;网络搜索引擎[A];2009全国计算机网络与通信学术会议论文集[C];2009年
4 孟奇奎;;一种基于数据库和用户反馈信息的元搜索引擎数据库选择算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 吴冷冬;童云海;唐世渭;;面向在线音乐视频的元搜索引擎VMS[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
6 夏小玲;祁博民;廖顺和;;基于Web服务和元搜索引擎的数字图书馆中元数据互操作框架[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
7 陈伟雄;马少平;步建华;;基于元搜索引擎的多关键词检索技术[A];广东省电机工程学会2003-2004年度优秀论文集[C];2005年
8 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
9 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
10 吴远红;徐妙君;范银琛;;元搜索引擎中基于OWA算子的查询结果合成研究[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
中国重要报纸全文数据库 前10条
1 山东 张蕊;“闻香识引擎”[N];中国计算机报;2000年
2 ITBOY;探索出来的世界[N];电脑报;2004年
3 应晓敏 窦文华;他山之石[N];计算机世界;2003年
4 赵敏超;利用因特网查找信息三步骤[N];中国图书商报;2003年
5 王旭;中文智能搜索引擎[N];计算机世界;2001年
6 彭岩 艾迪明;网络信息“拉取”技术[N];计算机世界;2001年
7 易观网络咨询公司;引航“?”年代[N];中国计算机报;2000年
8 汤大权 张维明 邓苏 肖卫东 李勇;主动信息服务[N];计算机世界;2001年
9 搜索引擎9238;英文搜索四当家[N];中国计算机报;2001年
10 王宏;从我为网活 到网为我用[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
2 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
3 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
4 焦俊;基于多Agent系统的智能车辆自主行驶控制研究[D];合肥工业大学;2010年
5 贺利坚;多Agent系统中信任和信誉模型的研究[D];北京交通大学;2011年
6 高嘉爽;基于Agent及FEA的焊接加工过程协同设计系统研究[D];哈尔滨工业大学;2009年
7 兰少华;多Agent技术及其应用研究[D];南京理工大学;2002年
8 赵欣培;一种基于Agent的软件过程建模方法研究[D];中国科学院研究生院(软件研究所);2005年
9 王文玺;基于多Agent系统的自主式地面车辆关键技术研究[D];西南交通大学;2010年
10 黄红兵;基于涌现视角的多Agent系统分析研究[D];国防科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 张维华;基于聚类的中文元搜索引擎技术研究[D];南京邮电大学;2011年
2 徐洋;基于用户行为学习的农业信息元搜索引擎研究[D];中国农业科学院;2010年
3 姜国新;支持多语言标签优先的元搜索引擎结果聚类研究[D];浙江工商大学;2011年
4 郭瑾;基于元搜索的Web网络军事情报信息搜索技术研究[D];中国石油大学;2010年
5 彭喜化;基于Agent的元搜索引擎结果优化研究[D];西南农业大学;2004年
6 王金栋;元搜索引擎调度策略及结果排序算法的研究[D];燕山大学;2010年
7 王新;一种垂直元搜索引擎的研究[D];西北大学;2010年
8 冯冰洁;后缀树算法在元搜索引擎中的应用[D];暨南大学;2010年
9 张鑫;基于本体论的领域元搜索引擎的研究与设计[D];兰州大学;2010年
10 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978