收藏本站
《电子科技大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

个性化搜索引擎的研究与设计

史炜  
【摘要】:随着互联网的不断发展和日益普及,互联网上的信息也是增长快速,全世界的网页数量也高达40亿左右,在我国的数量也超过了3亿左右,与此同时搜索引擎的作用越来越显的极为重要,但是当前很多使用者对它的使用结果与预先想象的还是有很大的差距,原因就是在于用户查询到的信息往往是不需要的。浪费了大量的查询时间。为了提高搜索效率,就要在搜索引擎方面下功夫,所以搜索引擎还需要进一步的提高和发展。基于这一原因,本论文在分析网络服务的现有基础上,结合相关技术,规划了一个相对完整的个性化搜索引擎,并实现了它的一部分作用和功能。主要内容为:首先引入了搜索引擎的概念、分类、工作机制、搜索引擎的发展历史状况、个性化搜索引擎的根本工作原理及当前搜索引擎所存在的不足之处,其次描述了网络服务的定义和如何实现的一些环境、及当前网络服务的主要方法及以后的发展方向——个性化的搜索引擎,再次详细分析了当前WWW个性化搜索引擎的相关实例和个性化搜索引擎所需要的一系列技术,接着是设计出一个个性化搜索引擎系统,并对网络爬虫在搜索引擎中地位进行分析,并给出网络爬虫系统的总体设计,以及具体每个模块的设计,包括网页采集模块,网页分析模块,网页索引模块,最后实现了网络爬虫的各个功能模块,可以实现网页采集、存储扩展和网页分析的功能。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.3

【参考文献】
中国期刊全文数据库 前6条
1 庄毅,黎浩宏;搜索引擎技术现状及发展动向[J];计算机时代;2002年08期
2 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期
3 曾民族;网络信息检索现状和性能评价[J];情报学报;1997年02期
4 周大勇;网络环境下的个性化需求与个性化信息服务[J];情报杂志;2001年11期
5 刘静;论网络信息检索[J];图书情报工作;1999年01期
6 王智宇;搜索引擎Excite检索功能详述及评析[J];现代图书情报技术;2001年06期
中国硕士学位论文全文数据库 前2条
1 袁莉;基于Web的个性化信息服务机制[D];四川大学;2001年
2 吕韩飞;主题(topical)crawler及其应用——主题搜索引擎[D];浙江大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 吴剑霞;信息推送技术的原理及在图书馆的应用[J];科技情报开发与经济;2004年03期
2 刘金红,夏阳,陆余良;基于Ontology的网络元数据抽取系统的研究与实现[J];安徽电子信息职业技术学院学报;2004年Z1期
3 董玉德,王志诚,王明保,李道伦;基于WEB课件中动态题库的设计与开发[J];安徽纺织职业技术学院学报;2003年01期
4 徐抗美;计算机文献检索方式的合理选择[J];安庆师范学院学报(自然科学版);1997年03期
5 赵静;个性化信息检索及功能模型[J];图书与情报;2004年01期
6 查志华;李伟;;搜索引擎的技术现状及发展趋势[J];兵团教育学院学报;2006年03期
7 宋伟,王举成,马根峰,赵济林;Internet数据挖掘原理及实现[J];重庆邮电学院学报(自然科学版);2001年02期
8 刘军;基于贝叶斯网络的Web访问模式挖掘模型系统[J];成都信息工程学院学报;2004年01期
9 高琳,龚立群;网络信息检索工具的分类及其发展趋势[J];昌吉学院学报;2004年03期
10 李晓玲;Internet信息检索探讨[J];重庆交通学院学报;2001年03期
中国重要会议论文全文数据库 前10条
1 吴东辰;;比较国内外几种主要的搜索引擎[A];福建省图书馆学会2005年学术年会论文集[C];2005年
2 汪沛;;Isolex股市预测系统的设计与实现[A];促进企业信息化进程——第十届中国Java技术及应用大会文集[C];2007年
3 栾悉道;谢毓湘;文军;吴玲达;;基于知识库的主动式专题搜索引擎[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
4 汤志伟;王菁;;面向公众的电子政务个性化信息服务体系的构建[A];中国信息经济学会2007年学术年会论文集[C];2007年
5 王栋;陈勇;徐建良;;基于预测的BitTorrent种子评估方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
6 米晓红;;一种基于LSI的用户兴趣模型构建方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
7 史金成;胡学钢;;基于约束的数据流聚类研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
8 战晓苏;林宗楷;李正国;苏忠;张少华;;基于MAS的信息资源协同搜索系统的系统结构[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年
9 曹玮祺;梁华瑞;朱雷;李涓子;王克宏;;基于半结构化信息模型的信息检索[A];第六届全国计算机应用联合学术会议论文集[C];2002年
10 眭新光;沈蕾;燕继坤;朱中梁;;基于Adaboost的文本隐写分析[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
中国博士学位论文全文数据库 前10条
1 杨震;个性化信息获取方法的研究[D];大连理工大学;2004年
2 胡健;开放式分布协作信息技术[D];电子科技大学;2000年
3 张玉芳;基于媒体素材库的学习内容构建方法研究[D];重庆大学;2001年
4 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
5 蔡鸿明;用于创新设计的人脑模型体系构造及知识生成[D];西北工业大学;2002年
6 李洪宁;万维网地理信息系统分布式理论体系研究与实现[D];中国地质大学(北京);2003年
7 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年
8 陈石灵;协同开发环境中工作流管理理论与技术研究[D];南京理工大学;2002年
9 俞方桦;互联网信息资源整合研究[D];东华大学;2001年
10 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
中国硕士学位论文全文数据库 前10条
1 蔡铁军;CRM在电子商务环境下的应用[D];华中科技大学;2005年
2 张宇光;数字图书馆个性化信息服务关键技术研究[D];吉林大学;2005年
3 赵立刚;搜索引擎的研究与设计[D];吉林大学;2005年
4 黄建;个性化信息服务系统体系结构研究及应用[D];西南交通大学;2005年
5 李驰;基于用户类属的WEB个性化导航页的研究及实现[D];西南交通大学;2005年
6 程传鹏;基于分类的智能信息检索研究与实现[D];云南师范大学;2005年
7 史锦荣;基于多Agent智能搜索引擎模型研究[D];太原理工大学;2005年
8 王敏;基于柔性的Internet个性化服务系统的研究[D];燕山大学;2004年
9 王梅;农机企业知识管理及其解决方案的研究[D];中国农业大学;2005年
10 田宏钟;基于数据挖掘的证券业客户关系管理中的客户细分研究[D];东华大学;2005年
【二级参考文献】
中国期刊全文数据库 前10条
1 刘旭,王瑞云;网络环境下大学图书馆的机构变革[J];大学图书馆学报;1999年01期
2 文坤梅,卢正鼎,叶卫国,金莉;搜索引擎中页面更新策略的分析与改进[J];华中科技大学学报(自然科学版);2002年12期
3 王继民;国内综合性搜索引擎时新性的计算[J];计算机工程与应用;2003年21期
4 殷燕,白庆华,秦耕,成晓,李伟,杜磊;基于Multi Agent技术的信息挖掘系统研究[J];计算机应用研究;1999年12期
5 丁蔚,倪波;因特网信息服务新模式[J];情报理论与实践;2000年02期
6 曾民族;网络信息检索现状和性能评价[J];情报学报;1997年02期
7 喻连枝,喻连枝,蔡勖,高志远;World Wide Web 与超维检索[J];情报学报;1997年06期
8 张晓林;建立充分支持知识传播与创新的校园信息服务体系[J];四川大学学报(哲学社会科学版);1999年04期
9 卢共平;论数字图书馆的馆藏发展[J];图书馆建设;2000年04期
10 王忠,周士波;Internet英文搜索引擎评析[J];图书情报工作;1999年04期
【相似文献】
中国期刊全文数据库 前10条
1 张继刚;搜索引擎使用技巧[J];网络与信息;1999年09期
2 ;关键词搜索[J];每周电脑报;2000年38期
3 陈冰;;饿狼一样的网站提交工具——“提交饿狼”[J];科学之友;2000年07期
4 许斗;从Google看新一代搜索引擎的发展趋向[J];芜湖职业技术学院学报;2001年01期
5 周毅华;从搜索引擎的分类看其应用技巧[J];图书馆理论与实践;2002年06期
6 邹小筑;搜索引擎的选择与使用技巧[J];图书馆学研究;2002年05期
7 林燕;Google搜索引擎的搜索功能与使用技巧[J];河北科技图苑;2003年05期
8 林中;GOOGLE搜索引擎的关键词检索[J];中国信息导报;2003年03期
9 封剑待封喉;吸星大法“搜”天下 笑傲网络任我行——搜索引擎绝对专题[J];网络与信息;2003年07期
10 闫凡蕾;建设站内搜索的好帮手——Search Engine Maker[J];少年电世界;2003年08期
中国重要会议论文全文数据库 前10条
1 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
2 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年
3 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
4 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 陶冶;刘建勋;唐明董;;基于Map/Reduce的分布式Web服务搜索引擎设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
6 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
7 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
8 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
9 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年
10 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
中国重要报纸全文数据库 前10条
1 李一鑫;搜索排名的红与黑[N];财经时报;2007年
2 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年
3 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年
4 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,还是门户[N];中国计算机报;2005年
5 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年
6 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年
7 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年
8 本报记者  赵晓辉 孟昭丽;搜索引擎驶入“避风港”[N];中国证券报;2006年
9 孙琎;搜索引擎惊喜侵权官司止于“避风港”?[N];第一财经日报;2006年
10 姜蕊;问天下谁识搜索?[N];中国高新技术产业导报;2006年
中国博士学位论文全文数据库 前10条
1 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
2 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
3 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
4 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
5 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
6 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
7 王镠璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
8 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
9 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
10 陈德品;基于迁移学习的跨领域排序学习算法研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 屠辉;中文重复网页的检测算法研究[D];北京邮电大学;2010年
2 陈瑜芳;主题爬虫系统的研究[D];武汉理工大学;2010年
3 史晶晶;基于CRF的Web机构实体信息抽取系统[D];吉林大学;2011年
4 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年
5 黄伟光;网页木马的防御与检测技术研究[D];北京交通大学;2011年
6 易方昶;基于网页后门木马监测系统的研究和设计[D];北京化工大学;2010年
7 陈艳斐;基于用户兴趣模型的校园网搜索引擎设计与应用[D];云南大学;2010年
8 王征;基于布隆过滤器算法的网页消重技术的实现与应用[D];北京交通大学;2010年
9 卢承山;基于领域的主题信息采集技术研究[D];武汉理工大学;2011年
10 尹力;网页防篡改系统在校园网中的应用研究[D];河北科技大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026