收藏本站
《山东科技大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于查询扩展的垂直搜索研究

吕芳芳  
【摘要】:随着因特网的快速发展,Web上的信息量越来越大,为了帮助人们从海量的信息资源中查找到自己所需要的信息,搜索引擎应运而生并且得到了迅速发展。然而,人们对信息专业化和精细化程度的不断提高,传统的搜索引擎已经不能很好的满足人们的需求,面向专业领域的垂直搜索却越来越受到人们的青睐。垂直搜索是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户,是搜索引擎的细分和延伸。 在信息检索中,用户输入的查询关键词不能准确的描述用户复杂的查询请求,因此基于关键词的机械的字符匹配方式将可能会导致一些与用户查询相关的文档不能被成功地检索出来,这是影响检索性能的一个关键问题。查询扩展可以在一定程度上解决这种词的不匹配现象,本文在上述研究的基础上,通过对已有查询扩展方法的分析,提出了一种基于本体的查询扩展策略并对其展开研究。本文主要内容如下: (1)研究并分析了传统的基于链接的分析技术(PageRank算法、HITS算法及HillTop算法)的原理和不足,并针对垂直搜索的特点提出了面向垂直搜索的v-PageRank算法来对查询返回结果进行排序,且实验验证了新算法的改进优于原有算法。 (2)通过对基于关键词查询局限性和查询扩展方法的分析,提出了一种基于本体的查询扩展策略,该策略考虑了查询关键词与本体中概念匹配的三种不同情况,并构建了手机领域本体。 (3)本文结合手机领域本体,设计了一个基于查询扩展的垂直搜索引擎的原型系统,并对其进行了实验验证,实验证明该搜索引擎比传统的搜索引擎具有更好的查全率和查准率。
【学位授予单位】:山东科技大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.3

【参考文献】
中国期刊全文数据库 前10条
1 李善平,尹奇韡,胡玉杰,郭鸣,付相君;本体论研究综述[J];计算机研究与发展;2004年07期
2 李绍华;高文宇;;基于层次分类的页面排序算法[J];计算机工程;2007年11期
3 张超盟;李战怀;温宗臣;;局部上下文分析剪枝概念树的查询扩展[J];计算机工程;2009年14期
4 张敏,宋睿华,马少平;基于语义关系查询扩展的文档重构方法[J];计算机学报;2004年10期
5 周立柱,林玲;聚焦爬虫技术研究综述[J];计算机应用;2005年09期
6 黄文蓓;杨静;顾君忠;;基于分块的网页正文信息提取算法研究[J];计算机应用;2007年S1期
7 罗建利;;基于用户兴趣的局部上下文分析方法[J];计算机应用研究;2007年04期
8 邓顺国;试论搜索引擎的发展趋势[J];图书馆理论与实践;2003年05期
9 刘畅;;综合搜索引擎与垂直搜索引擎的比较研究[J];情报科学;2007年01期
10 杜文华;本体构建方法比较研究[J];情报杂志;2005年10期
中国硕士学位论文全文数据库 前2条
1 谭义红;关联规则挖掘及其在概念检索中的应用研究[D];湖南大学;2003年
2 邹文科;基于本体技术的语义检索及其语义相似度研究[D];北京邮电大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 孙素芬;罗长寿;张峻峰;于峰;张树亮;;农业信息资源整合系统研究与应用[J];安徽农业科学;2007年22期
2 郑怀国;谭翠萍;李光达;常春;;植物病虫害防治本体模型构建研究[J];安徽农业科学;2009年02期
3 汪斌;张云伟;刘健;陈晶;;一种面向农业信息主题网络爬虫的设计[J];安徽农业科学;2009年20期
4 廉捷;刘云;;网络舆情中的信息预处理与自动摘要算法[J];北京交通大学学报;2010年05期
5 唐琨皓;杨贯中;刘燕玲;;基于本体的任务模型研究与应用[J];办公自动化;2009年02期
6 梁晔;周海燕;;本体论与语义Web[J];北京联合大学学报(自然科学版);2007年01期
7 向胜军;赵一;;基于本体的语义检索系统的设计[J];北京石油化工学院学报;2011年04期
8 牟冬梅;王丽伟;;知识组织系统中关系模式的应用比较[J];图书与情报;2006年05期
9 任斌;毛应爽;;基于本体的主动学习主题爬行的研究与实现[J];长春工程学院学报(自然科学版);2011年01期
10 祝伟华;李嘉毅;刘斌斌;;二手汽车交易信息垂直搜索网的设计[J];重庆工学院学报(自然科学版);2008年08期
中国重要会议论文全文数据库 前8条
1 梁勇;张文;;网络舆情采集系统的设计[A];2011年全国通信安全学术会议论文集[C];2011年
2 姚文琳;王莉;王璀民;;基于Ontology的知识检索系统的设计与实现[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
3 王栋;陈勇;徐建良;;基于预测的BitTorrent种子评估方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
4 刘兵;胡学钢;;基于多链接分析的主题爬虫设计实现[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
5 戴玉刚;;藏文网页采集技术研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
6 林建方;李生;郑德权;;基于词语搭配关系的查询扩展方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
7 缪嘉嘉;李爱平;刘志忠;吴泉源;贾焰;;一种面向语义信息集成的本体扩展方法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
8 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
中国博士学位论文全文数据库 前10条
1 周扬;面向中药药性多维表征体系的中药本体研究[D];山东中医药大学;2010年
2 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
3 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年
4 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
5 王强;空间信息服务聚合的关键技术研究[D];解放军信息工程大学;2010年
6 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
7 赵娜;基于知识地图的多领域本体语义互联研究[D];吉林大学;2011年
8 蔡盈芳;基于本体的航空产品知识库构建研究[D];北京交通大学;2011年
9 萧毅鸿;基于本体的复杂决策任务表示方法与求解技术研究[D];南京大学;2011年
10 曾帅;普适计算环境下的信任管理研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 厉颖;基于本体的服装领域知识表示的建模研究[D];山东科技大学;2010年
2 翁岩青;网页抓取策略研究[D];哈尔滨工程大学;2010年
3 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
4 赵阳耀;基于本体的数据源映射方法与策略[D];哈尔滨工程大学;2010年
5 程波波;基于文本的茶学本体学习方法研究[D];安徽农业大学;2010年
6 徐济成;面向农业领域的本体学习建模研究[D];安徽农业大学;2010年
7 吉喆;基于本体的茶树虫害智能诊断系统研究[D];安徽农业大学;2010年
8 肖好冰;本体构建与网络交流平台的设计与实现[D];中国海洋大学;2010年
9 刘召栋;基于电子政务平台的政府竞争情报系统研究[D];湘潭大学;2010年
10 潘拓宇;融入用户行为上下文的个性化推荐模型[D];湘潭大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 黄卿贤,胡谷雨;基于本体的网络管理知识模型[J];北京邮电大学学报;2003年S2期
3 白同强,刘磊;语义Web的研究与展望[J];吉林大学学报(信息科学版);2004年02期
4 陈刚,金芝,陆汝钤;虚拟企业及其协作模型[J];电子学报;2002年S1期
5 黄建莲;中国搜索引擎服务市场的现状及发展[J];华北科技学院学报;2005年03期
6 陆汝钤,石纯一,张松懋,毛希平,徐晋晖,杨萍,范路;面向Agent的常识知识库[J];中国科学E辑:技术科学;2000年05期
7 王建勇,单松巍,雷鸣,谢正茂,李晓明;海量Web搜索引擎系统中用户行为的分布特征及其启示[J];中国科学E辑:技术科学;2001年04期
8 周斌,吴泉源,高洪奎;序列模式挖掘的增量式算法的设计原则[J];计算机研究与发展;2000年10期
9 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期
10 武成岗,焦文品,田启家,史忠植;基于本体论和多主体的信息检索服务器[J];计算机研究与发展;2001年06期
【相似文献】
中国期刊全文数据库 前10条
1 李莉;高庆狮;;一种基于语义单元的查询扩展方法[J];计算机科学;2008年02期
2 李文骏;崔志明;;基于搜索引擎的Deep Web数据源发现技术[J];计算机技术与发展;2008年08期
3 王会进,陈超华,李清;基于动态知识库搜索引擎的技术[J];暨南大学学报;2004年01期
4 牟力科;张蕾;张晓孪;;基于概念图的用户兴趣查询扩展模型的研究[J];计算机工程与应用;2008年06期
5 邹良群;周春雷;;基于搜索引擎的公开情报自动化搜集模型[J];电脑知识与技术;2008年26期
6 李小琳;陆汝占;;基于日志挖掘的查询概念图扩展[J];计算机应用与软件;2010年03期
7 裴飞;洪宇;孙常龙;姚建民;朱巧明;;基于Web的查询扩展[J];电脑知识与技术;2011年06期
8 熊桂喜;王开锋;;基于语义的查询扩展研究[J];微计算机信息;2008年30期
9 蒋辉;阳小华;;基于文档与搜索结果上下文的查询扩展方法[J];计算机应用;2009年03期
10 王丽君,高迎,王锡钢;中文检索系统中查询的扩展[J];小型微型计算机系统;2002年07期
中国重要会议论文全文数据库 前10条
1 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
2 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年
3 马云龙;林鸿飞;;基于权重标准化SimRank方法的查询扩展技术研究[A];第六届全国信息检索学术会议论文集[C];2010年
4 陈忆群;曹瑾音;印鉴;;查询扩展树:关系数据库中的文本检索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 周斌;刘茂福;陈建勋;;IR4QA系统中基于维基百科的查询扩展[A];第五届全国青年计算语言学研讨会论文集[C];2010年
6 钟敏娟;万常选;;基于伪反馈的XML查询扩展[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
7 黄名选;;基于正负关联规则挖掘的局部反馈查询扩展[A];第六届全国信息检索学术会议论文集[C];2010年
8 陈志玮;肖诗斌;施水才;王昕;;一种基于HTML位置信息的查询扩展技术[A];第三届学生计算语言学研讨会论文集[C];2006年
9 徐小琴;章成志;;Web信息检索中相关词提示技术与评测[A];第三届学生计算语言学研讨会论文集[C];2006年
10 郭文;史晓东;陈毅东;;跨语言信息检索中的查询扩展[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国重要报纸全文数据库 前10条
1 魏蓓;中文商业搜索引擎提供垂直搜索服务[N];市场报;2006年
2 ;移动垂直搜索开拓中国搜索新天地[N];人民邮电;2006年
3 本报记者 杜华斌;——垂直搜索使网上购物更容易[N];科技日报;2005年
4 元元;从单向搜索转向多维和垂直搜索[N];证券日报;2006年
5 赛迪顾问互联网产业研究中心咨询师 危贵川;鏖战搜索强者胜 垂直搜索亮点多[N];市场报;2008年
6 郭白岩;垂直搜索正在抢综合搜索的“饭碗”[N];中国经营报;2008年
7 李永胜;垂直搜索:Google们漏掉的空档?[N];中国计算机报;2006年
8 沉风;垂直搜索:互联网服务生活新方向[N];人民邮电;2007年
9 薛娟;垂直搜索盯紧风投的口袋?[N];中国经济时报;2006年
10 商报记者  吴辰光;搜索引擎市场趋向细分化[N];北京现代商报;2006年
中国博士学位论文全文数据库 前10条
1 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
2 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
3 王一川;基于内容的海量文本探索式查询导引中若干关键技术的研究[D];北京邮电大学;2011年
4 朱鲲鹏;基于Web日志挖掘的智能信息检索研究[D];哈尔滨工业大学;2009年
5 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
6 王瑞琴;基于语义处理技术的信息检索模型研究[D];浙江大学;2009年
7 梅翔;语义检索中若干关键问题的研究[D];北京邮电大学;2007年
8 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
9 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
10 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 贾淑芳;基于用户日志聚类的查询扩展[D];北京邮电大学;2010年
2 王水利;基于互信息的语义查询扩展技术研究[D];河南科技大学;2011年
3 方勇;基于语义的信息检索方法研究与应用[D];浙江大学;2010年
4 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年
5 刘清江;同义词在文本特征提取与查询扩展中的应用[D];河北大学;2010年
6 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
7 于水;专利术语知识库的建立与应用[D];沈阳航空工业学院;2010年
8 周剑烽;基于语义本体的信息检索方法的研究[D];杭州电子科技大学;2010年
9 赵春辉;基于关联规则挖掘的查询扩展[D];河南大学;2011年
10 胡珍新;面向用户的查询扩展研究与实现[D];江西师范大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026