收藏本站
《西安电子科技大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

智能元搜索引擎关键技术研究

李红梅  
【摘要】: 现有的搜索引擎存在覆盖率低和查准率低的缺陷,无法充分满足用户对信息的快速性与有效性要求。元搜索引擎通过调用多个搜索引擎来实现搜索,能较好解决现有搜索引擎的缺陷,但仍然存在智能化程度低、搜索结果的易用性差、无法满足个性化需求等问题。 本文系统综述了智能元搜索引擎技术的研究现状和发展趋势,设计了一个基于Multi-Agent的智能元搜索引擎系统结构模型,并对其中的关键技术进行了研究。数据挖掘能够提取数据中隐含的知识,Web数据挖掘技术应用于搜索引擎中,为Web信息的利用提出了新的解决方案。Agent技术的发展日趋成熟,可有效应用于用户个性化智能信息检索中。因此,Web数据挖掘技术、智能Agent技术与元搜索引擎技术相融合,可提高元搜索引擎的智能化水平,使元搜索引擎技术上升到一个新的高度。本文的主要创新性成果如下所述: 1.在元搜索引擎中吸收了聚类搜索引擎和个性化检索的关键元素,提出了一个基于Multi-Agent的智能元搜索引擎系统结构模型。采用移动Agent和常驻Agent相结合的搜索机制使系统具有更强的适应性,利用并行约简算法实现了常驻Agent对搜索结果的动态合并,可有效避免在结果合成Agent处产生瓶颈。给出了用户个性化模式的表示机制和更新机制,运用个性化检索和聚类浏览相结合的检索方式既能满足用户的个性化要求,提高用户查询的查准率,又能实现对搜索结果的结构化组织,便于用户快速定位有效信息。 2.提出了一种基于虚拟语言模型的成员搜索引擎选择算法。采用将成员搜索引擎数据库与概念相关联的技术,通过静态学习得到数据库与各个概念之间的相关度,并建立数据库的特征描述。对于用户查询,先将其映射到相关概念,然后利用虚拟语言模型计算查询与成员搜索引擎数据库之间的相关性,结合用户对搜索引擎的偏好度实现个性化的成员搜索引擎调度策略。本算法可以弥补Web信息检索中短查询存在的问题,同时提高数据库选择的速度。实验结果表明该算法在搜索结果的查询精度上比采用CORI算法有明显的提高。 3.针对结果合成算法中搜索引擎性能不均衡带来的问题,提出了一种基于群决策的合成算法。对搜索结果的排序位置和文本信息进行规范化处理得到文档的相关分值,平衡搜索引擎之间的差异。利用搜索引擎的性能评价,提出改进的影子文档方法估算非相关文档的分值。考虑成员搜索引擎对用户查询意图的相关程度因素,引入群决策思想实现对搜索结果的排序,将与用户查询意图密切相关的结果排在搜索结果的前面,从而提高查准率。该算法充分利用搜索结果的信息,计算简单、易于实现。实验结果表明与成员搜索引擎相比,其平均相关性有明显提高,并且优于Round-robin、CombSum和CombMNZ三种合成算法。 4.为了获得明确的聚类主题,提出了一种基于概念分组的Web搜索结果聚类算法。对概念分组算法进行了改进,突破了其对查询特征项的限制,利用特征词的同现文档频率来建立概念分组,进而挖掘Web搜索结果之间的语义关联,产生对查询主题的概念描述,实现对搜索结果的聚类。类别标签的选择综合考虑了特征词在类内和文档集中的重要性,使得标签具有较强的文档区分性。算法中对特征词选择进行了优化,保证了产生的类别标签具有明确的含义;通过对搜索结果的语义挖掘,实现了对Web搜索结果的主题发现,同时,具有对同义词的扩展能力。该算法具有较低的时间复杂度,能够满足实时的、语义的、重叠聚类的要求。实验结果表明该算法聚类性能较好,明显优于K-means聚类算法,并且具有较强的自适应性。与中文聚类搜索引擎比比猫相比,在聚类质量和类别标签上都与之相近,但能够产生含义更为明确的类别标签。
【学位授予单位】:西安电子科技大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP391.3

【引证文献】
中国期刊全文数据库 前3条
1 李翠霞;;现代计算机智能识别技术处理自然语言研究的应用与进展[J];科学技术与工程;2012年36期
2 刘胜久;李天瑞;贾真;尹红风;;元搜索引擎排序方法建模与算法研究[J];计算机科学;2012年S3期
3 李鑫洪;李庆华;刘炜娜;;国内Web数据挖掘研究综述[J];现代计算机(专业版);2013年35期
【参考文献】
中国期刊全文数据库 前10条
1 雷鸣,王建勇,赵江华,单松巍,陈葆珏;第三代搜索引擎与天网二期[J];北京大学学报(自然科学版);2001年05期
2 刘晖,李明禄;基于抽象状态机的网格系统设计和分析[J];电子学报;2003年S1期
3 史庆伟;赵政;朝柯;;一种基于后缀树的中文网页层次聚类方法[J];辽宁工程技术大学学报;2006年06期
4 张强弓,喻国宝,廖湖声,隋树林;一种元搜索引擎的查询结果处理模型[J];华南理工大学学报(自然科学版);2004年S1期
5 文坤梅,卢正鼎,陈莉,邓曦;元搜索引擎中检索结果排序的优化方法[J];华中科技大学学报(自然科学版);2003年03期
6 汪晓岩,胡庆生,李斌,庄镇泉;面向Internet的个性化智能信息检索[J];计算机研究与发展;1999年09期
7 张志强,邢春晓,周立柱,孙静,钱乾;SESQ系统的一种查询优化策略[J];计算机研究与发展;2004年10期
8 易高翔;胡和平;;一种基于容错粗糙集的Web搜索结果聚类方法[J];计算机研究与发展;2006年02期
9 张刚;刘悦;郭嘉丰;程学旗;;一种层次化的检索结果聚类方法[J];计算机研究与发展;2008年03期
10 田萱,刘希玉,孟强;实现Web页面的智能个性化检索[J];计算机工程与应用;2003年01期
【共引文献】
中国期刊全文数据库 前10条
1 陈智;钱言玉;;基于用户兴趣的个性化搜索引擎研究[J];合肥师范学院学报;2010年03期
2 朱中仁;;基于Petri网的工作流模型构建[J];安徽电子信息职业技术学院学报;2012年01期
3 董玉德,王志诚,王明保,李道伦;基于WEB课件中动态题库的设计与开发[J];安徽纺织职业技术学院学报;2003年01期
4 方冉;陈乃金;;基于S3C44B0X处理器触摸屏接口的设计与测试[J];安徽工程科技学院学报(自然科学版);2010年02期
5 孙素芬;罗长寿;张峻峰;于峰;张树亮;;农业信息资源整合系统研究与应用[J];安徽农业科学;2007年22期
6 代秀娟;章昭辉;王敏生;杨娟;潘冬生;汪小寒;;旅游信息服务组合的Petri网建模及其实现[J];安徽师范大学学报(自然科学版);2011年04期
7 金莹;丁峰;;广义随机Petri网在工作流建模中的应用研究[J];安庆师范学院学报(自然科学版);2010年01期
8 卢效峰,郑权;基于用户行为分析的搜索引擎模型[J];北方工业大学学报;2004年03期
9 承向军,杨肇夏;基于多智能体技术的城市交通控制系统的探讨[J];北方交通大学学报;2002年05期
10 沈鹏;焦利明;杨建立;;基于Petri网的防空旅C4ISR系统决策组织结构[J];兵工自动化;2005年06期
【同被引文献】
中国期刊全文数据库 前10条
1 胡庆华;Web搜索引擎中Mobile Agent动态路由问题研究[J];安徽大学学报(自然科学版);2003年03期
2 宋丽哲,牛振东,宋瀚涛,余正涛,师雪霖;数字图书馆个性化服务用户模型研究[J];北京理工大学学报;2005年01期
3 马爱芳,王宝英,赵建梅;我国网络科技期刊出版现状及其改进对策[J];编辑学报;2005年02期
4 马爱芳;王宝英;姜志静;周晓光;;我国纯网络科技期刊发展现状及改进对策探析[J];编辑学报;2006年03期
5 李红梅;丁振国;周水生;周利华;;元搜索引擎结果合成算法[J];北京邮电大学学报;2008年05期
6 陈德礼;;基于JXTA的层次性P2P搜索引擎框架的研究与设计[J];重庆工学院学报(自然科学版);2007年07期
7 赖祖龙;万幼川;申邵洪;徐景中;;基于Hilbert排列码与R树的海量LIDAR点云索引[J];测绘科学;2009年06期
8 曾韬;应用非结构化信息管理技术实现多层次知识管理需求[J];中国传媒科技;2004年06期
9 刘必雄,蔡建兵;当前分布式计算解决方案简介[J];重庆科技学院学报;2005年01期
10 李光雷;张世禄;;云计算在资料查询中的应用初探[J];大连大学学报;2009年06期
【二级引证文献】
中国期刊全文数据库 前2条
1 侯亚君;;计算机语言识别技术应用的探究[J];电脑开发与应用;2014年03期
2 刘胜久;李天瑞;贾真;景运革;;基于搜索引擎的相似度研究与应用[J];计算机科学;2014年04期
【二级参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 刘琼,杨红杰,汪永琳;Agent与基于Agent系统[J];常德师范学院学报(自然科学版);2000年01期
3 杨晓春,王丹,王国仁,于戈;虚拟企业环境中支持完整性约束的主动规则[J];东北大学学报;2001年01期
4 林鸿飞,马雅彬;基于聚类的文本过滤模型[J];大连理工大学学报;2002年02期
5 王如海,刘建设;Agent技术与模糊信息[J];电脑与信息技术;1999年06期
6 常继传,李克勤,郭立峰,梅宏,杨芙清;青鸟系统中可复用软件构件的表示与查询[J];电子学报;2000年08期
7 王建勇,谢正茂,雷鸣,李晓明;近似镜像网页检测算法的研究与评价[J];电子学报;2000年S1期
8 韩立新,陈贵海,谢立;一个面向Internet的个性化信息检索系统模型[J];电子学报;2002年02期
9 薛云皎,钱乐秋,花鸣,张天戈,杨珉;一种基于关联挖掘的自适应构件检索方法[J];电子学报;2004年S1期
10 杨芙清,梅宏,李克勤;软件复用与软件构件技术[J];电子学报;1999年02期
【相似文献】
中国期刊全文数据库 前10条
1 马燕,邹显春,包骏杰,李明;一种互联网智能元搜索引擎模型的设计[J];重庆师范大学学报(自然科学版);2004年03期
2 屈长青,李艳芳;元搜索引擎的关键技术[J];现代计算机;2004年05期
3 胡亮,许永诚,高文,胡利平;个性化高效元搜索引擎的设计与实现[J];计算机工程与设计;2005年04期
4 ;来信[J];电子商务世界;2008年01期
5 仇海峰;元搜索引擎[J];中国计算机用户;1997年32期
6 张卫丰;徐宝文;周晓宇;李东;许蕾;;元搜索引擎研究[J];计算机科学;2001年08期
7 蔡耿青;搜索引擎——互联网之神[J];教育信息化;2003年09期
8 张付志,刘明业;一种基于元搜索引擎的数字图书馆系统集成框架[J];北京理工大学学报;2004年08期
9 伏汉英,黄永忠,陈新,杨凯,郭金庚;一种基于Java的元搜索引擎的设计与实现[J];信息工程大学学报;2004年04期
10 刘炜,陈俊杰;一种基于Agent的智能元搜索引擎框架[J];计算机工程与应用;2005年03期
中国重要会议论文全文数据库 前10条
1 阳小华;刘振宇;谭敏生;刘杰;左贵启;;元搜索引擎查询结果的合成方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 李慧;张民;宋源清;;网络搜索引擎[A];2009全国计算机网络与通信学术会议论文集[C];2009年
3 孟奇奎;;一种基于数据库和用户反馈信息的元搜索引擎数据库选择算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 余晋;邓志鸿;田敬;唐世渭;;PinkySearch:基于聚类的元搜索引擎[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 吴冷冬;童云海;唐世渭;;面向在线音乐视频的元搜索引擎VMS[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
6 夏小玲;祁博民;廖顺和;;基于Web服务和元搜索引擎的数字图书馆中元数据互操作框架[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
7 陈伟雄;马少平;步建华;;基于元搜索引擎的多关键词检索技术[A];广东省电机工程学会2003-2004年度优秀论文集[C];2005年
8 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
9 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
10 吴远红;徐妙君;范银琛;;元搜索引擎中基于OWA算子的查询结果合成研究[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
中国重要报纸全文数据库 前10条
1 山东 张蕊;“闻香识引擎”[N];中国计算机报;2000年
2 ITBOY;探索出来的世界[N];电脑报;2004年
3 赵敏超;利用因特网查找信息三步骤[N];中国图书商报;2003年
4 王旭;中文智能搜索引擎[N];计算机世界;2001年
5 彭岩 艾迪明;网络信息“拉取”技术[N];计算机世界;2001年
6 易观网络咨询公司;引航“?”年代[N];中国计算机报;2000年
7 应晓敏 窦文华;他山之石[N];计算机世界;2003年
8 搜索引擎9238;英文搜索四当家[N];中国计算机报;2001年
9 应晓敏 窦文华;条条道路通罗马[N];计算机世界;2003年
10 刘洋;数字时代如何写好英语论文[N];中华读书报;2002年
中国博士学位论文全文数据库 前4条
1 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
2 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
3 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
4 徐明;对等网络中的查询路由与重构机制[D];复旦大学;2010年
中国硕士学位论文全文数据库 前10条
1 王美霞;面向主题的元搜索引擎技术研究与系统实现[D];天津理工大学;2013年
2 李磊;个性化元搜索引擎关键技术的研究[D];内蒙古科技大学;2013年
3 王金栋;元搜索引擎调度策略及结果排序算法的研究[D];燕山大学;2010年
4 王新;一种垂直元搜索引擎的研究[D];西北大学;2010年
5 冯冰洁;后缀树算法在元搜索引擎中的应用[D];暨南大学;2010年
6 张鑫;基于本体论的领域元搜索引擎的研究与设计[D];兰州大学;2010年
7 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
8 刘林;基于语义的元搜索引擎关键技术研究[D];河南工业大学;2010年
9 王春艳;元搜索引擎的研究与实现[D];吉林大学;2011年
10 刘海;建立基于元搜索引擎的语音库查询收集系统[D];淮北师范大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026