收藏本站
《山东科技大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于查询扩展的垂直搜索研究

吕芳芳  
【摘要】:随着因特网的快速发展,Web上的信息量越来越大,为了帮助人们从海量的信息资源中查找到自己所需要的信息,搜索引擎应运而生并且得到了迅速发展。然而,人们对信息专业化和精细化程度的不断提高,传统的搜索引擎已经不能很好的满足人们的需求,面向专业领域的垂直搜索却越来越受到人们的青睐。垂直搜索是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户,是搜索引擎的细分和延伸。 在信息检索中,用户输入的查询关键词不能准确的描述用户复杂的查询请求,因此基于关键词的机械的字符匹配方式将可能会导致一些与用户查询相关的文档不能被成功地检索出来,这是影响检索性能的一个关键问题。查询扩展可以在一定程度上解决这种词的不匹配现象,本文在上述研究的基础上,通过对已有查询扩展方法的分析,提出了一种基于本体的查询扩展策略并对其展开研究。本文主要内容如下: (1)研究并分析了传统的基于链接的分析技术(PageRank算法、HITS算法及HillTop算法)的原理和不足,并针对垂直搜索的特点提出了面向垂直搜索的v-PageRank算法来对查询返回结果进行排序,且实验验证了新算法的改进优于原有算法。 (2)通过对基于关键词查询局限性和查询扩展方法的分析,提出了一种基于本体的查询扩展策略,该策略考虑了查询关键词与本体中概念匹配的三种不同情况,并构建了手机领域本体。 (3)本文结合手机领域本体,设计了一个基于查询扩展的垂直搜索引擎的原型系统,并对其进行了实验验证,实验证明该搜索引擎比传统的搜索引擎具有更好的查全率和查准率。
【学位授予单位】:山东科技大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.3

免费申请
【参考文献】
中国期刊全文数据库 前10条
1 李善平,尹奇韡,胡玉杰,郭鸣,付相君;本体论研究综述[J];计算机研究与发展;2004年07期
2 李绍华;高文宇;;基于层次分类的页面排序算法[J];计算机工程;2007年11期
3 张超盟;李战怀;温宗臣;;局部上下文分析剪枝概念树的查询扩展[J];计算机工程;2009年14期
4 张敏,宋睿华,马少平;基于语义关系查询扩展的文档重构方法[J];计算机学报;2004年10期
5 周立柱,林玲;聚焦爬虫技术研究综述[J];计算机应用;2005年09期
6 黄文蓓;杨静;顾君忠;;基于分块的网页正文信息提取算法研究[J];计算机应用;2007年S1期
7 罗建利;;基于用户兴趣的局部上下文分析方法[J];计算机应用研究;2007年04期
8 邓顺国;试论搜索引擎的发展趋势[J];图书馆理论与实践;2003年05期
9 刘畅;;综合搜索引擎与垂直搜索引擎的比较研究[J];情报科学;2007年01期
10 杜文华;本体构建方法比较研究[J];情报杂志;2005年10期
【共引文献】
中国期刊全文数据库 前10条
1 孙素芬;罗长寿;张峻峰;于峰;张树亮;;农业信息资源整合系统研究与应用[J];安徽农业科学;2007年22期
2 郑怀国;谭翠萍;李光达;常春;;植物病虫害防治本体模型构建研究[J];安徽农业科学;2009年02期
3 汪斌;张云伟;刘健;陈晶;;一种面向农业信息主题网络爬虫的设计[J];安徽农业科学;2009年20期
4 廉捷;刘云;;网络舆情中的信息预处理与自动摘要算法[J];北京交通大学学报;2010年05期
5 唐琨皓;杨贯中;刘燕玲;;基于本体的任务模型研究与应用[J];办公自动化;2009年02期
6 梁晔;周海燕;;本体论与语义Web[J];北京联合大学学报(自然科学版);2007年01期
7 向胜军;赵一;;基于本体的语义检索系统的设计[J];北京石油化工学院学报;2011年04期
8 牟冬梅;王丽伟;;知识组织系统中关系模式的应用比较[J];图书与情报;2006年05期
9 任斌;毛应爽;;基于本体的主动学习主题爬行的研究与实现[J];长春工程学院学报(自然科学版);2011年01期
10 祝伟华;李嘉毅;刘斌斌;;二手汽车交易信息垂直搜索网的设计[J];重庆工学院学报(自然科学版);2008年08期
【二级参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 黄卿贤,胡谷雨;基于本体的网络管理知识模型[J];北京邮电大学学报;2003年S2期
3 白同强,刘磊;语义Web的研究与展望[J];吉林大学学报(信息科学版);2004年02期
4 陈刚,金芝,陆汝钤;虚拟企业及其协作模型[J];电子学报;2002年S1期
5 黄建莲;中国搜索引擎服务市场的现状及发展[J];华北科技学院学报;2005年03期
6 陆汝钤,石纯一,张松懋,毛希平,徐晋晖,杨萍,范路;面向Agent的常识知识库[J];中国科学E辑:技术科学;2000年05期
7 王建勇,单松巍,雷鸣,谢正茂,李晓明;海量Web搜索引擎系统中用户行为的分布特征及其启示[J];中国科学E辑:技术科学;2001年04期
8 周斌,吴泉源,高洪奎;序列模式挖掘的增量式算法的设计原则[J];计算机研究与发展;2000年10期
9 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期
10 武成岗,焦文品,田启家,史忠植;基于本体论和多主体的信息检索服务器[J];计算机研究与发展;2001年06期
【相似文献】
中国期刊全文数据库 前10条
1 王明文,聂建云;基于Dempster-Shafer理论的查询扩展模型(英文)[J];江西师范大学学报(自然科学版);2005年03期
2 章旭;石进;谢立;;基于相似性叙词表的模糊集合模型[J];计算机科学;2008年09期
3 闭剑婷;苏一丹;;基于潜在语义分析的跨语言查询扩展方法[J];计算机工程;2009年10期
4 申丽平;;WordNet在查询扩展中的应用研究[J];科技信息;2009年14期
5 张超盟;李战怀;温宗臣;;局部上下文分析剪枝概念树的查询扩展[J];计算机工程;2009年14期
6 李东园;白宇;蔡东风;;面向中文问答的信息检索系统及评测[J];沈阳航空工业学院学报;2009年03期
7 王会进,陈超华,李清;基于动态知识库搜索引擎的技术[J];暨南大学学报;2004年01期
8 牟力科;张蕾;张晓孪;;基于概念图的用户兴趣查询扩展模型的研究[J];计算机工程与应用;2008年06期
9 陈晓金;王兵;;信息检索扩展技术研究[J];图书情报工作;2008年12期
10 李小琳;陆汝占;;基于日志挖掘的查询概念图扩展[J];计算机应用与软件;2010年03期
中国重要会议论文全文数据库 前10条
1 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年
2 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
3 陈忆群;曹瑾音;印鉴;;查询扩展树:关系数据库中的文本检索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
4 马云龙;林鸿飞;;基于权重标准化SimRank方法的查询扩展技术研究[A];第六届全国信息检索学术会议论文集[C];2010年
5 周斌;刘茂福;陈建勋;;IR4QA系统中基于维基百科的查询扩展[A];第五届全国青年计算语言学研讨会论文集[C];2010年
6 钟敏娟;万常选;;基于伪反馈的XML查询扩展[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
7 黄名选;;基于正负关联规则挖掘的局部反馈查询扩展[A];第六届全国信息检索学术会议论文集[C];2010年
8 邵兵;关毅;王强;王晓龙;任瑞春;;基于上下文平均互信息的问句查询扩展模型[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 黄佳来;王立波;袁道敏;;基于语义相似度的查询扩展研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
10 李东园;白宇;蔡东风;;基于用户日志分析的查询扩展研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国重要报纸全文数据库 前1条
1 彭遂莅 李涛;成都公开保险营销员信用信息[N];中国保险报;2011年
中国博士学位论文全文数据库 前10条
1 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
2 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
3 王俊义;正负相关反馈与查询扩展技术的研究[D];内蒙古大学;2012年
4 王一川;基于内容的海量文本探索式查询导引中若干关键技术的研究[D];北京邮电大学;2011年
5 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
6 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
7 朱鲲鹏;基于Web日志挖掘的智能信息检索研究[D];哈尔滨工业大学;2009年
8 刘春辰;基于本体的企业搜索优化技术研究[D];吉林大学;2012年
9 王秉卿;基于机器学习的查询优化研究[D];复旦大学;2012年
10 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
中国硕士学位论文全文数据库 前10条
1 贾淑芳;基于用户日志聚类的查询扩展[D];北京邮电大学;2010年
2 王水利;基于互信息的语义查询扩展技术研究[D];河南科技大学;2011年
3 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年
4 方勇;基于语义的信息检索方法研究与应用[D];浙江大学;2010年
5 刘清江;同义词在文本特征提取与查询扩展中的应用[D];河北大学;2010年
6 于水;专利术语知识库的建立与应用[D];沈阳航空工业学院;2010年
7 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
8 周剑烽;基于语义本体的信息检索方法的研究[D];杭州电子科技大学;2010年
9 赵春辉;基于关联规则挖掘的查询扩展[D];河南大学;2011年
10 胡珍新;面向用户的查询扩展研究与实现[D];江西师范大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026