收藏本站
《河南工业大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于语义的元搜索引擎关键技术研究

刘林  
【摘要】: 随着Internet技术的不断发展和完善,互联网上的信息呈现爆炸式的增长。为了能够从庞大数量的资源中获取有价值的信息,搜索引擎应运而生。然而面对Internet文档的动态性、无结构化和半结构化的特点,搜索引擎存在着覆盖范围小、数据库更新周期长等局限性。为了能够充分发挥独立搜索引擎的检索效率,采用独立搜索引擎作为子检索工具的元搜索引擎在近年来成为广大研究者重点关注的领域之一。 本文通过对元搜索引擎和本体技术的研究,发现可以利用本体知识表达的特性来提高元搜索引擎对用户查询信息的智能化理解。且本体是概念模型的明确的形式化规范说明,具有语义分析的能力,因此将本体应用到元搜索引擎中,实现对用户查询的语义处理和语义理解的功能,具有巨大的现实意义和应用价值。本文的重点工作如下: (1)元搜索引擎的系统结构模型 本文在深入研究相关技术的基础上,设计了一种基于语义的元搜索引擎模型。该模型框架可以从网络上获取非结构和半结构化的主题信息,并利用其进行本体标注。融合本体的语义特征和元搜索引擎的优点,在不失适合性的前提下有效的提高了用户的满意度以及检索结果的相关性。 (2)查询扩展的预处理算法 针对查询关键字语义相关性不高的问题,提出了一种基于语义的预处理算法。利用本体之间的层次结构,计算语义概念层次树上的相关性,并在概念相似度的计算中引入深度制约函数,然后通过与本体知识库的映射,达到对其进行基于本体的语义扩展。实验表明,该算法大大地增加了页面的命中数,有效地提高了元搜索引擎查询结果相关性。 (3)结果处理算法 在以往研究的基础上,通过将结果融合技术融入到本体4级结果处理中,提出了基于结果融合技术的本体4级结果处理算法。该算法通过对搜索结果的去重、引入词条匹配等级、计算相关度、排序方法等操作来实现对返回结果的详细处理。通过实验与分析表明,该算法能够有效的提高与用户查询请求的相关度,满足了用户的真实查询意图。 (4)分析与验证 在基于语义的元搜索引擎模型的基础上,分别对预处理模块中使用的预处理算法和结果处理模块中的结果处理算法进行了验证和分析。实验表明在模型结构的基础上该两种算法在时间效率和用户满意度上具有可行性和有效性。
【学位授予单位】:河南工业大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.3

【引证文献】
中国硕士学位论文全文数据库 前1条
1 冯杨;营养评价与膳食智能决策支持系统设计研究[D];河南工业大学;2011年
【参考文献】
中国期刊全文数据库 前10条
1 文坤梅,卢正鼎,陈莉,邓曦;元搜索引擎中检索结果排序的优化方法[J];华中科技大学学报(自然科学版);2003年03期
2 栾艳 ,丁二玉 ,骆斌;基于Ontology的语义检索技术[J];计算机工程与应用;2005年28期
3 张卫丰;徐宝文;周晓宇;许蕾;李东;;Web搜索引擎综述[J];计算机科学;2001年09期
4 廖明宏;本体论与信息检索[J];计算机工程;2000年02期
5 刘丽,孙燕唐;智能型元搜索引擎的设计与实现[J];计算机工程;2003年06期
6 曹二堂;刘玉林;;一种基于语义理解的元搜索引擎的研究[J];计算机工程;2006年07期
7 冯林;于孝航;孙焘;沈骁;潘晓雯;;基于最长公共子序列距离的主旨模式挖掘算法[J];计算机工程;2008年14期
8 张敏,宋睿华,马少平;基于语义关系查询扩展的文档重构方法[J];计算机学报;2004年10期
9 孙昊,刘玉照;网络环境下检索效果评价标准浅析[J];情报杂志;2003年01期
10 阳小华,刘振宇,谭敏生,刘杰,张敏捷;元搜索引擎系统合成算法的约束条件[J];软件学报;2002年07期
【共引文献】
中国期刊全文数据库 前10条
1 丁一;龚家才;;基于半完全图在数据融合中的元搜索研究[J];湖北师范学院学报(自然科学版);2008年02期
2 谢坤武;;智能桌面元搜索引擎中个性化研究[J];湖北民族学院学报(自然科学版);2006年04期
3 周红静;杨金民;;ORM中基于语义相似性的查询缓存替换策略[J];湖南大学学报(自然科学版);2009年11期
4 陈文庆,朱伟忠;基于OLE DB for DM的文本分类系统的设计与实现[J];河南师范大学学报(自然科学版);2005年03期
5 王红涛;李梅;王晓东;;基于Ontology的学习资源检索模型研究[J];河南师范大学学报(自然科学版);2008年06期
6 岳明;孙滨;王晓东;;基于意见词汇Ontology的意见属性自动标注模型研究[J];河南师范大学学报(自然科学版);2011年02期
7 黄佳来;王立波;袁道敏;;基于语义相似度的查询扩展研究[J];杭州电子科技大学学报;2008年05期
8 桑秀芝;;浅析Web元搜索引擎排序算法[J];合作经济与科技;2012年05期
9 李卫疆;赵铁军;王宪刚;;基于上下文的查询扩展[J];计算机研究与发展;2010年02期
10 刘炜,陈俊杰;一种基于Agent的智能元搜索引擎框架[J];计算机工程与应用;2005年03期
中国重要会议论文全文数据库 前5条
1 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
2 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
3 廖光忠;黄泽鑫;;基于HowNet语义算法的研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
4 林建方;李生;郑德权;;基于词语搭配关系的查询扩展方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
中国博士学位论文全文数据库 前10条
1 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
2 蔡盈芳;基于本体的航空产品知识库构建研究[D];北京交通大学;2011年
3 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
4 汤华茂;基于语义的产业链网络化协同设计模式及关键技术研究[D];重庆大学;2010年
5 郭春芬;基于本体的工艺知识管理关键技术研究[D];山东科技大学;2011年
6 魏军英;基于WEB服务的中小企业制造资源共享关键技术研究[D];山东科技大学;2011年
7 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
8 齐元胜;基于设计知识重用的集成产品快速开发技术的理论与实践[D];武汉理工大学;2003年
9 李四明;基于智能Agent的网上农业信息挖掘研究[D];中国农业大学;2003年
10 俞方桦;互联网信息资源整合研究[D];东华大学;2001年
中国硕士学位论文全文数据库 前10条
1 岳广飞;基于二次搜索的搜索引擎技术研究[D];山东科技大学;2010年
2 吕芳芳;基于查询扩展的垂直搜索研究[D];山东科技大学;2010年
3 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
4 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
5 许锦;基于本体的智能答疑系统研究与实现[D];江西师范大学;2010年
6 毛敏芹;对搜索引擎扩充语义信息功能方法研究[D];华东师范大学;2010年
7 刘杰雄;基于本体的爆破行业信息搜索技术的研究[D];华南理工大学;2010年
8 宋向瑛;面向资源整合的党校教务管理系统的设计与实现[D];华南理工大学;2010年
9 樊春雷;基于语义分析的糖尿病健康教育系统研究与实现[D];华东理工大学;2011年
10 周月红;基于Lucene的站内搜索引擎的设计与开发[D];华东理工大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 魏凤梅;胡文;;基于模拟退火算法营养膳食优选的研究[J];哈尔滨商业大学学报(自然科学版);2006年06期
2 李善平,尹奇韡,胡玉杰,郭鸣,付相君;本体论研究综述[J];计算机研究与发展;2004年07期
3 袁磊;张浩;陈静;陆剑峰;;基于本体化知识模型的知识库构建模式研究[J];计算机工程与应用;2006年30期
4 王高平;王永骥;;改进的多目标遗传算法在营养决策中应用[J];计算机工程与应用;2007年04期
5 刘冰;申丽红;李涛;;知识库系统原理探讨[J];软件导刊;2009年09期
6 吕友波;;量子遗传算法在配餐中的应用[J];商场现代化;2008年08期
7 史春秀;;基于本体的知识形式化表示[J];山西师范大学学报(自然科学版);2007年02期
8 高明辉,周严平,陶庆;电脑配餐的实践与方法[J];食品科学;1990年06期
9 汤利飞;营养配菜是科学膳食的必然趋势[J];食品研究与开发;1996年04期
10 王高平,范改芳,刘素华;人体饮食营养配餐决策支持系统的研究与实现[J];郑州大学学报(自然科学版);2000年04期
【二级参考文献】
中国期刊全文数据库 前10条
1 朱礼军,陶兰,刘慧;领域本体中的概念相似度计算[J];华南理工大学学报(自然科学版);2004年S1期
2 王继成,邹涛,杨小江,潘金贵,张福炎;基于Internet的信息资源发现技术与实现[J];计算机研究与发展;1999年11期
3 尤昉,李涓子,王作英;基于《知网》的中文信息结构抽取研究[J];计算机工程与应用;2002年18期
4 杜阿宁,方滨兴,胡铭曾,云晓春;中文交互式网络搜索引擎及其自学习能力[J];计算机工程与应用;2003年10期
5 张卫丰;徐宝文;周晓宇;李东;许蕾;;元搜索引擎研究[J];计算机科学;2001年08期
6 彭洪汇;林作铨;;Internet上的搜索引擎和元搜索引擎[J];计算机科学;2002年09期
7 欧洁;;基于相关术语集的搜索引擎选择[J];计算机科学;2003年07期
8 吴健,吴朝晖,李莹,邓水光;基于本体论和词汇语义相似度的Web服务发现[J];计算机学报;2005年04期
9 陈亮,李雪梅,陈世福;个性化元搜索引擎AIP MSE的设计与实现[J];计算机应用研究;2003年12期
10 周强,冯松岩;构建知网关系的网状表示[J];中文信息学报;2000年06期
【相似文献】
中国期刊全文数据库 前10条
1 朱茂盛,王斌,程学旗;元搜索引擎及其实现[J];计算机工程;2002年11期
2 刘丽,孙燕唐;智能型元搜索引擎的设计与实现[J];计算机工程;2003年06期
3 谢树龙,张杰,刘洪,仪熊晓;元搜索引擎技术分析[J];天津通信技术;2004年02期
4 何晓聪;元搜索引擎的理论与实践[J];现代情报;2004年08期
5 曾伟忠,徐昕;搜索引擎及元搜索引擎工作原理及存在的不足[J];图书馆学刊;2004年05期
6 屈长青,李艳芳;元搜索引擎的关键技术[J];现代计算机(专业版);2004年05期
7 刘畅,林剑锋,王雁杰;元搜索引擎的调查分析[J];现代图书情报技术;2004年09期
8 徐戈;一个文件元搜索引擎的设计与实现[J];情报探索;2004年04期
9 吴国文,乐嘉锦,陈国梁;源搜索可定制的元搜索引擎设计技术[J];计算机应用与软件;2004年12期
10 黄素珍,陈宁江,苏德富;并发多元搜索引擎的研究与应用[J];广西大学学报(自然科学版);2005年02期
中国重要会议论文全文数据库 前9条
1 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
2 阳小华;刘振宇;谭敏生;刘杰;左贵启;;元搜索引擎查询结果的合成方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 孟奇奎;;一种基于数据库和用户反馈信息的元搜索引擎数据库选择算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 诸葛建伟;袁春阳;;基于元搜索引擎实现被篡改网站发现与攻击者调查剖析[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
5 陈伟雄;马少平;步建华;;基于元搜索引擎的多关键词检索技术[A];广东省电机工程学会2003-2004年度优秀论文集[C];2005年
6 丁山山;陈世平;;智能Agent技术在个性化WEB信息代理中的应用研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
7 余晋;邓志鸿;田敬;唐世渭;;PinkySearch:基于聚类的元搜索引擎[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
8 吴冷冬;童云海;唐世渭;;面向在线音乐视频的元搜索引擎VMS[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
9 吴远红;徐妙君;范银琛;;元搜索引擎中基于OWA算子的查询结果合成研究[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
中国重要报纸全文数据库 前1条
1 喻芸;管理和科研:如何利用网络资源[N];学习时报;2007年
中国博士学位论文全文数据库 前3条
1 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
2 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
3 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
2 王春艳;元搜索引擎的研究与实现[D];吉林大学;2011年
3 郭琰;元搜索引擎的关键技术研究及系统实现[D];南京理工大学;2002年
4 李炎茗;元搜索引擎的现状研究与改进设计[D];华中师范大学;2002年
5 洪颖;面向化工领域的智能元搜索引擎系统的研究与设计[D];北京化工大学;2004年
6 蔡春勇;元搜索引擎的智能化及其设计与实验[D];福州大学;2006年
7 王小朋;基于代理的元搜索引擎的研究[D];辽宁工程技术大学;2005年
8 魏振达;基于服务的元搜索引擎研究[D];南华大学;2006年
9 李信利;基于信息类别的元搜索引擎研究[D];山东大学;2006年
10 谢江标;最优搜索理论在元搜索引擎中的应用研究[D];电子科技大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026