收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

宠物用品垂直搜索引擎研究与设计

陈向东  
【摘要】: 当今的互联网已经成为信息的海洋,虽然门户网站集中了大量的信息和访问量,中小网站的信息量和访问量总和更是远远超过门户网站。通用搜索引擎提供了从信息海洋撷取信息的有效方式,但面对指数级增长的海量信息,通用搜索引擎提供的检索结果在准确性上已经不能满足用户的需要,特别是利用传统搜索引擎来进行专业领域的深度搜索时,其查全率和查准率远远不能满足用户的个性化需求。因此,利用垂直搜索引擎进行精准搜索越来越成为搜索引擎领域的研究热点和发展趋势。 随着中国经济的快速发展和人们生活水平的提高,与此同时社会生活节奏加快。为了缓解压力,改善生活质量,越来越多的人选择领养宠物来调节生活。据有关部门不完全统计,仅中国就有将近一亿条(只)宠物,宠物用品市场发展迅速前景良好,宠物相关经济越来越成为推动国民经济增长的有利因素,然而目前宠物市场鱼目混珠,产品良莠不齐,很难令宠物爱好者挑选到满意的产品。 在本文系统中通过对宠物用品需求背景进行研究分析,利用垂直搜索引擎技术,对互联网上的知名宠物用品网站中的宠物用品信息内容进行采集,利用开源搜索引擎Lucene框架和Heritrix爬虫,实现了宠物用品搜索引擎的研究与设计,主要研究工作如下: (1)针对宠物用品的特点和宠物用品搜索引擎的需求分析,确定了系统的基本功能需求和设计方案,完成了系统的功能模块设计和数据存储以及系统数据备份策略。 (2)对Heritrix爬虫框架加以改进,实现对宠物用品信息的抓取与定制。 (3)在系统抓取模块中加入了主题预测算法,建立了专业宠物用品词库,使其适合于主题搜索引擎,提高了抓取网页的主题相关度。 (4)利用PageRank算法改进原有Lucene排序算法,对搜索结果进行相关度排序,提高了搜索引擎的查准率。 (5)以Eclipse为开发环境,设计和实现了宠物用品垂直搜索引擎核心模块。通过系统测试,本文设计和实现的宠物用品垂直搜索引擎的方案是切实可行的,能够满足用户的检索需求。与通用搜索引擎相比,搜索效率有了进一步提高,搜索引擎的的查准率有了明显的提高,系统基本达到了预期的设计目标,满足了用户的个性化检索需求。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 边凯;;你会搜索吗?[J];中国计算机用户;2007年23期
2 陈利国;刘忠民;;搜索引擎的工作原理和发展趋势[J];电脑知识与技术(学术交流);2007年23期
3 张敏;;基于本体的垂直搜索引擎的研究[J];软件导刊;2010年02期
4 胡永锋;;浅谈垂直搜索引擎的工作原理[J];科学大众(科学教育);2011年06期
5 庄芯;;风投押宝垂直搜索 各方巨头介入又添疑点[J];IT时代周刊;2008年01期
6 顾鹏尧;;让搜索引擎更好地服务于教育教学[J];科学24小时;2003年Z1期
7 陈新颜;垂直搜索引擎辨析[J];现代情报;2004年09期
8 胡文胜;;垂直搜索助号码百事通与商务领航[J];每周电脑报;2006年32期
9 胡洁;丁宁;关静;曹福年;张磊;;基于“PUBMED+PDF”的医学垂直搜索引擎的实践[J];信息系统工程;2009年05期
10 一林;;垂直搜索:前进路上的喜与忧[J];互联网天地;2010年02期
11 田野;垂直搜索火热为哪般[J];中国计算机用户;2005年37期
12 胡文胜;;垂直搜索助号码百事通与商务领航[J];每周电脑报;2006年31期
13 陈洪猛;;基于垂直搜索技术的搜索引擎解决方案[J];电脑应用技术;2008年01期
14 郑凯明;李义杰;;垂直搜索引擎及其应用价值[J];信息技术;2008年04期
15 宿建光;;指点通:移动垂直搜索的创新者[J];通信世界;2007年03期
16 王雪冬;李伟英;李强;;商业主题搜索引擎的研究[J];商场现代化;2008年29期
17 白坤;耿国华;;基于Lucene/Heritrix的垂直搜索引擎的研究与应用[J];计算机应用与软件;2009年01期
18 张美芳;张迎春;;浅议垂直搜索引擎服务市场的商业模式[J];现代商业;2010年06期
19 李占波;廖继东;李华;;基于DotLucene的垂直搜索引擎的研究[J];微计算机信息;2007年24期
20 祁宁;吴齐;赵青;;面向主题信息服务的垂直搜索引擎应用研究[J];图书馆学研究;2008年09期
中国重要会议论文全文数据库 前10条
1 韩近强;赵静;杨冬青;唐世渭;姚小波;;基于领域知识的网页筛选系统[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 王晓峰;刘惟一;;从用户需求到网页集团的模糊变换[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
3 吴倩;杨逍;张兆心;;基于视觉特征的网页信息提取[A];第六届全国信息检索学术会议论文集[C];2010年
4 罗阳;季铎;张桂平;王莹莹;;面向单一网页的双语资源挖掘方法[A];第六届全国信息检索学术会议论文集[C];2010年
5 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
6 张贯虹;乌达巴拉;巩政;;基于向量空间模型的网页文本句子对齐方法研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 林欢欢;王文杰;史忠植;;移动环境下垂直搜索引擎[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 赵玉芳;张一鸣;;基于网页信息的印象形成的初步研究[A];第十届全国心理学学术大会论文摘要集[C];2005年
9 张阳;李战怀;近藤广幸;;WEB PAGE的自动分类[A];第十六届全国数据库学术会议论文集[C];1999年
10 王旭;杜军平;;质检总局互联网舆情监控系统中聚焦爬虫的研究[A];中国电子学会第十七届信息论学术年会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年
2 王晔;垂直搜索引擎若干问题研究[D];复旦大学;2011年
3 胡宜敏;农业垂直搜索引擎语义化若干问题的研究与实现[D];中国科学技术大学;2012年
4 焦斌星;用于搜索的网页可视化摘要技术研究[D];中国科学技术大学;2012年
5 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
6 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
7 王镠璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
8 刘守群;海量网络视频快速检索关键技术研究[D];中国科学技术大学;2010年
9 黄河;农业复杂自适应搜索模型研究及实现[D];中国科学技术大学;2010年
10 段瑞雪;基于依存关系的用户意图的研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 王鹏;垂直搜索引擎的研究[D];武汉理工大学;2010年
2 于洪波;中文网页自动采集与分类系统设计与实现[D];北京邮电大学;2010年
3 钟鸿鹏;基于时态信息的网页排序系统的研究与实现[D];华南理工大学;2010年
4 张航;主题爬虫的实现及其关键技术研究[D];武汉理工大学;2010年
5 冯明远;深度网络信息爬取关键技术研究与实现[D];浙江大学;2010年
6 邓科;智能搜索中的中文网页分类研究[D];兰州理工大学;2011年
7 薛惠;基于JAVA的移动新闻搜索引擎的研究与设计[D];河北科技大学;2010年
8 赵立磊;基于网页去重的垂直搜索引擎设计与实现[D];大连理工大学;2012年
9 党春辉;网页消重和聚类算法在高校搜索引擎中的研究与应用[D];东华大学;2010年
10 马伟瑜;基于改进的PageRank的网页信息可信度评估方法研究[D];河北大学;2011年
中国重要报纸全文数据库 前10条
1 电子工业出版社 董娅 工业和信息化部电子科学技术情报研究所 周峻松;用开源软件建垂直搜索引擎[N];计算机世界;2010年
2 王艳;垂直搜索引擎市场看好[N];中国旅游报;2000年
3 赛迪网 方刚;不只是网站才垂直[N];中国计算机报;2000年
4 王靖;赛迪网推出垂直搜索引擎[N];人民日报海外版;2000年
5 壮壮;批量保存网页信息[N];电脑报;2004年
6 东方早报记者 李伟;要名还是要利,这是个问题[N];东方早报;2011年
7 记者 王浒;“去哪儿”旅行网完成第三轮1500万美元融资[N];中国旅游报;2009年
8 金山软件副总裁 杨桓;着力“三大系统” 构筑网络安全屏障[N];中国电子报;2009年
9 郭京霞;枫叶之都状告百度恶意排名一审败诉[N];中国知识产权报;2007年
10 路人甲;请个专家来贴图[N];电脑报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978