收藏本站
《西北大学》 2010年 硕士论文
收藏 | 手机打开
二维码
手机客户端打开本文

一种垂直元搜索引擎的研究

王新  
【摘要】: 相比较传统全文搜索引擎,垂直搜索引擎可以为用户提供更专业、更准确的知识,避免用户在大量的数据中筛选与专业相关的知识,是搜索引擎的研究热点和发展趋势。目前垂直搜索引擎采用与通用全文搜索引擎类似的全文检索系统结构,在专业相关度方面具有相当高的水平。但与通用全文搜索引擎类似,全文检索的垂直搜索引擎存在着查全率较低、网络资源消耗过多等问题。针对这些问题,本文提出了一个基于元搜索技术的垂直搜索引擎系统结构,虽然结果的专业相关度有所下降,却提高了垂直搜索引擎的查全率。经过实验,证明了该系统可以满足用户垂直搜索的需要。论文的主要工作有: 1.针对目前垂直搜索引擎网络信息覆盖率较低的问题,提出了采用网络信息覆盖率更高的元搜索引擎作为信息收集的垂直搜索引擎系统结构。针对元搜索引擎不具有信息收集和分析功能的特点,为改进结果以适应垂直搜索的需要,系统增加了信息收集和信息分析功能。 2.信息收集是搜索引擎的基础,本文针对目前垂直搜索引擎信息收集中存在的网络信息覆盖率较低、被收集信息中无效信息较多等问题,提出了基于统计用户浏览时间的信息收集方法。该方法在网络信息覆盖率更高的元搜索引擎结果的基础上收集大量用户关注度较高的信息,一方面增加了信息的覆盖率,另一方面增加了被收集信息的专业相关度。 3.信息检索是搜索引擎的核心,本文引入数据挖掘对所收集的信息进行分析,得出用户满意度较高的信息中词汇与查询关键词之间的相关规则。提出了隐形关键词的概念,并将隐形关键词用于信息检索。实验证明加入隐形关键词的搜索可以提高系统查询结果的专业相关度。 4.用户最关心搜索结果的前面的结果,所以结果排序是搜索引擎必须要重视的问题。目前,元搜索引擎结果排序所用到的信息较少,不能保证结果的相关度。本文提出适合系统结果排序的排序方法。并针对引入隐形关键词的搜索提出了改进后的位置排序算法,增加结果的专业相关度。 本文提出了一种基于元搜索技术的垂直搜索解决方案,为垂直搜索引擎的设计提供了一个新的思路。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 毛佳;康慕宁;;元搜索引擎的个性化调度算法[J];微处理机;2008年06期
2 徐家树,覃征,陈伟雄,步建华;Web页面相关度算法[J];华南理工大学学报(自然科学版);2004年S1期
3 张卫丰;徐宝文;周晓宇;李东;许蕾;;元搜索引擎研究[J];计算机科学;2001年08期
4 楼松斋,张惠惠;中文电子期刊的元搜索引擎[J];情报科学;2003年11期
5 屈长青,李艳芳;元搜索引擎的关键技术[J];现代计算机;2004年05期
6 李肖红;马丽平;;搜索引擎技术现状及趋势分析[J];社会科学论坛(学术研究卷);2005年05期
7 李明;中文元搜索引擎万纬搜索研究[J];现代图书情报技术;2003年05期
8 刘丽;元搜索引擎结果显示方式研究[J];情报杂志;2005年06期
9 晏一平;岳泉;;中外元搜索引擎的比较研究[J];图书馆学研究;2005年11期
10 翁勍力;施水才;赵捧未;;基于网页摘要分析的元搜索引擎研究[J];现代图书情报技术;2006年12期
11 胡双双;秦杰;谢蕙;;一种实用元搜索引擎的设计与实现[J];微电子学与计算机;2009年04期
12 唐培丽;胡明;解飞;;元搜索引擎研究[J];气象水文海洋仪器;2005年Z1期
13 马家宇,阳小华,刘振宇,陶滔,谭敏生;基于弱实时系统的元搜索引擎合成策略[J];计算技术与自动化;2004年02期
14 姬洪强;;元搜索引擎——检索资料的好帮手[J];中小学信息技术教育;2007年12期
15 王晓丹;胡乔迁;;信息检索中元搜索引擎结果选择策略[J];哈尔滨商业大学学报(自然科学版);2008年04期
16 陈伟雄,马少平,步建华;基于元搜索引擎的多关键词检索技术[J];计算机工程与应用;2004年24期
17 马燕,邹显春,包骏杰,李明;一种互联网智能元搜索引擎模型的设计[J];重庆师范大学学报(自然科学版);2004年03期
18 胡亮,许永诚,高文,胡利平;个性化高效元搜索引擎的设计与实现[J];计算机工程与设计;2005年04期
19 ;来信[J];电子商务世界;2008年01期
20 仇海峰;元搜索引擎[J];中国计算机用户;1997年32期
中国重要会议论文全文数据库 前10条
1 阳小华;刘振宇;谭敏生;刘杰;左贵启;;元搜索引擎查询结果的合成方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 李宇翔;李双红;李茹;;基于社区问答的问题相关度检测研究[A];第六届全国信息检索学术会议论文集[C];2010年
3 陈伟雄;马少平;步建华;;基于元搜索引擎的多关键词检索技术[A];广东省电机工程学会2003-2004年度优秀论文集[C];2005年
4 李慧;张民;宋源清;;网络搜索引擎[A];2009全国计算机网络与通信学术会议论文集[C];2009年
5 孟奇奎;;一种基于数据库和用户反馈信息的元搜索引擎数据库选择算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 余晋;邓志鸿;田敬;唐世渭;;PinkySearch:基于聚类的元搜索引擎[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
7 吴冷冬;童云海;唐世渭;;面向在线音乐视频的元搜索引擎VMS[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
8 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
9 昝红英;苏玉梅;孙斌;俞士汶;;基于浅层分析的网页相关度研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 夏小玲;祁博民;廖顺和;;基于Web服务和元搜索引擎的数字图书馆中元数据互操作框架[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
中国博士学位论文全文数据库 前10条
1 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
2 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
3 杨建波;基于多小波及遗传算法的数字水印技术研究[D];吉林大学;2005年
4 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
5 曲卫民;中文XML信息检索系统的研究[D];中国科学院研究生院(软件研究所);2004年
6 冯登国;频谱理论及其在通信保密技术中的应用[D];西安电子科技大学;1995年
7 肖仕武;同步发电机定子绕组内部故障暂态仿真及其应用的研究[D];华北电力大学(北京);2003年
8 洪宇;基于语义结构和时序特征的话题检测与跟踪技术研究[D];哈尔滨工业大学;2009年
9 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
10 钟茂生;基于内容相关度计算的文本结构分析方法研究[D];上海交通大学;2010年
中国硕士学位论文全文数据库 前10条
1 王新;一种垂直元搜索引擎的研究[D];西北大学;2010年
2 刘林;基于语义的元搜索引擎关键技术研究[D];河南工业大学;2010年
3 王金栋;元搜索引擎调度策略及结果排序算法的研究[D];燕山大学;2010年
4 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
5 王春艳;元搜索引擎的研究与实现[D];吉林大学;2011年
6 王莎莎;元搜索引擎结果合成技术的研究[D];燕山大学;2011年
7 郭瑾;基于元搜索的Web网络军事情报信息搜索技术研究[D];中国石油大学;2010年
8 张腾宇;元搜索引擎中结果聚合排序方法的研究[D];北京工业大学;2012年
9 杨煜;基于元搜索的住房信息搜索系统的设计与实现[D];吉林大学;2012年
10 姚永祥;基于XTM的政务知识导航系统的研究与实现[D];大连理工大学;2006年
中国重要报纸全文数据库 前10条
1 世纪证券综合研究所 刘昆;业绩与仓位变动相关度不高[N];证券时报;2006年
2 本报评论员 戎国彭;股票与期货,哪个离你更近?[N];杭州日报;2008年
3 联合证券 王慧;中小板保持强势[N];中国证券报;2008年
4 李云林;美国债券市场的六个特点[N];学习时报;2007年
5 本报记者 丰捷;高校需要准确定位[N];光明日报;2009年
6 吉宝飞;新年度棉价要看八大因素[N];中华合作时报;2008年
7 山东 张蕊;“闻香识引擎”[N];中国计算机报;2000年
8 蒋瑛琨 彭艳;震荡市中的ETF选择[N];上海证券报;2007年
9 中信建投期货 孙晓飞钱灿;台、港股市大幅振荡 期现走势基本一致[N];期货日报;2007年
10 王妍;蓝筹发力 业绩的作用有多大[N];金融时报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978