收藏本站
《河南工业大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于语义的元搜索引擎关键技术研究

刘林  
【摘要】: 随着Internet技术的不断发展和完善,互联网上的信息呈现爆炸式的增长。为了能够从庞大数量的资源中获取有价值的信息,搜索引擎应运而生。然而面对Internet文档的动态性、无结构化和半结构化的特点,搜索引擎存在着覆盖范围小、数据库更新周期长等局限性。为了能够充分发挥独立搜索引擎的检索效率,采用独立搜索引擎作为子检索工具的元搜索引擎在近年来成为广大研究者重点关注的领域之一。 本文通过对元搜索引擎和本体技术的研究,发现可以利用本体知识表达的特性来提高元搜索引擎对用户查询信息的智能化理解。且本体是概念模型的明确的形式化规范说明,具有语义分析的能力,因此将本体应用到元搜索引擎中,实现对用户查询的语义处理和语义理解的功能,具有巨大的现实意义和应用价值。本文的重点工作如下: (1)元搜索引擎的系统结构模型 本文在深入研究相关技术的基础上,设计了一种基于语义的元搜索引擎模型。该模型框架可以从网络上获取非结构和半结构化的主题信息,并利用其进行本体标注。融合本体的语义特征和元搜索引擎的优点,在不失适合性的前提下有效的提高了用户的满意度以及检索结果的相关性。 (2)查询扩展的预处理算法 针对查询关键字语义相关性不高的问题,提出了一种基于语义的预处理算法。利用本体之间的层次结构,计算语义概念层次树上的相关性,并在概念相似度的计算中引入深度制约函数,然后通过与本体知识库的映射,达到对其进行基于本体的语义扩展。实验表明,该算法大大地增加了页面的命中数,有效地提高了元搜索引擎查询结果相关性。 (3)结果处理算法 在以往研究的基础上,通过将结果融合技术融入到本体4级结果处理中,提出了基于结果融合技术的本体4级结果处理算法。该算法通过对搜索结果的去重、引入词条匹配等级、计算相关度、排序方法等操作来实现对返回结果的详细处理。通过实验与分析表明,该算法能够有效的提高与用户查询请求的相关度,满足了用户的真实查询意图。 (4)分析与验证 在基于语义的元搜索引擎模型的基础上,分别对预处理模块中使用的预处理算法和结果处理模块中的结果处理算法进行了验证和分析。实验表明在模型结构的基础上该两种算法在时间效率和用户满意度上具有可行性和有效性。
【学位授予单位】:河南工业大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.3

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 马燕,邹显春,包骏杰,李明;一种互联网智能元搜索引擎模型的设计[J];重庆师范大学学报(自然科学版);2004年03期
2 屈长青,李艳芳;元搜索引擎的关键技术[J];现代计算机;2004年05期
3 胡亮,许永诚,高文,胡利平;个性化高效元搜索引擎的设计与实现[J];计算机工程与设计;2005年04期
4 ;来信[J];电子商务世界;2008年01期
5 仇海峰;元搜索引擎[J];中国计算机用户;1997年32期
6 张卫丰;徐宝文;周晓宇;李东;许蕾;;元搜索引擎研究[J];计算机科学;2001年08期
7 蔡耿青;搜索引擎——互联网之神[J];教育信息化;2003年09期
8 张付志,刘明业;一种基于元搜索引擎的数字图书馆系统集成框架[J];北京理工大学学报;2004年08期
9 伏汉英,黄永忠,陈新,杨凯,郭金庚;一种基于Java的元搜索引擎的设计与实现[J];信息工程大学学报;2004年04期
10 刘炜,陈俊杰;一种基于Agent的智能元搜索引擎框架[J];计算机工程与应用;2005年03期
中国重要会议论文全文数据库 前10条
1 阳小华;刘振宇;谭敏生;刘杰;左贵启;;元搜索引擎查询结果的合成方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 李慧;张民;宋源清;;网络搜索引擎[A];2009全国计算机网络与通信学术会议论文集[C];2009年
3 孟奇奎;;一种基于数据库和用户反馈信息的元搜索引擎数据库选择算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 余晋;邓志鸿;田敬;唐世渭;;PinkySearch:基于聚类的元搜索引擎[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 吴冷冬;童云海;唐世渭;;面向在线音乐视频的元搜索引擎VMS[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
6 夏小玲;祁博民;廖顺和;;基于Web服务和元搜索引擎的数字图书馆中元数据互操作框架[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
7 陈伟雄;马少平;步建华;;基于元搜索引擎的多关键词检索技术[A];广东省电机工程学会2003-2004年度优秀论文集[C];2005年
8 张松宇;吕芳;;指纹图像预处理算法研究[A];全国第二届信号处理与应用学术会议专刊[C];2008年
9 王景中;叶锋;;汉字图像预处理算法在识别中的应用研究[A];2011年全国通信安全学术会议论文集[C];2011年
10 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
中国重要报纸全文数据库 前10条
1 山东 张蕊;“闻香识引擎”[N];中国计算机报;2000年
2 ITBOY;探索出来的世界[N];电脑报;2004年
3 赵敏超;利用因特网查找信息三步骤[N];中国图书商报;2003年
4 王旭;中文智能搜索引擎[N];计算机世界;2001年
5 彭岩 艾迪明;网络信息“拉取”技术[N];计算机世界;2001年
6 易观网络咨询公司;引航“?”年代[N];中国计算机报;2000年
7 应晓敏 窦文华;他山之石[N];计算机世界;2003年
8 搜索引擎9238;英文搜索四当家[N];中国计算机报;2001年
9 应晓敏 窦文华;条条道路通罗马[N];计算机世界;2003年
10 刘洋;数字时代如何写好英语论文[N];中华读书报;2002年
中国博士学位论文全文数据库 前10条
1 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
2 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
3 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
4 穆学文;{-1,1}二次规划算法及其应用研究[D];西安电子科技大学;2006年
5 仲卫涛;过程系统的大规模优化问题研究[D];浙江大学;2001年
6 汪大宝;复杂背景下的红外弱小目标检测与跟踪技术研究[D];西安电子科技大学;2010年
7 刘中华;光照变化条件下的人脸特征抽取算法研究[D];南京理工大学;2011年
8 曲峰;活细胞内GLUT4囊泡纳米级三维实时定位技术的研究[D];华中科技大学;2011年
9 徐明;对等网络中的查询路由与重构机制[D];复旦大学;2010年
10 赵大兴;基于机器视觉的坯布表面质量检测系统研究与实现[D];东北大学;2009年
中国硕士学位论文全文数据库 前10条
1 刘林;基于语义的元搜索引擎关键技术研究[D];河南工业大学;2010年
2 王金栋;元搜索引擎调度策略及结果排序算法的研究[D];燕山大学;2010年
3 王新;一种垂直元搜索引擎的研究[D];西北大学;2010年
4 冯冰洁;后缀树算法在元搜索引擎中的应用[D];暨南大学;2010年
5 张鑫;基于本体论的领域元搜索引擎的研究与设计[D];兰州大学;2010年
6 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
7 王春艳;元搜索引擎的研究与实现[D];吉林大学;2011年
8 刘海;建立基于元搜索引擎的语音库查询收集系统[D];淮北师范大学;2011年
9 李亚;元搜索引擎的个性化技术研究[D];燕山大学;2011年
10 王莎莎;元搜索引擎结果合成技术的研究[D];燕山大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026