收藏本站
《武汉理工大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于LUCENE的群体个性化搜索引擎研究

文义  
【摘要】: Internet是一个高度开放、异构和分布式的信息空间,海量的信息杂乱地散布在全球各个站点上,而且每天都以极快的速度更新。随着互联网技术的发展和网络应用的日益广泛,Internet已经成为了人们获取信息资源和进行信息交流的一个重要途径。伴随着互联网的发展,Web信息也日益增长,如何从海量的互联网资料中找到自己需要的信息,成为了阻碍互联网发展的一大难题。虽然传统搜索引擎的出现极大地提高了网络信息的检索速度,在一定程度上解决了这个问题,但还是无法满足人们对信息服务日益增长的个性化需求。同时,在这个讲究个性和以人为本的时代,个性化和人性化的搜索引擎也成为了时代的需要,使得个性化搜索引擎成为了当前一个重要的研究课题。 本文针对传统搜索引擎在用户个性化需求方面存在的不足,提出了一种全新的个性化理念,即群体个性化搜索。利用个性化信息采集系统收集和提取用户的个性化信息,通过扩展用户需求和优化搜索过程和结果,为用户提供个性化和人性化的信息搜索服务。本文所做的主要工作如下: 1、首先简要介绍了Lucene这个主流搜索引擎应用工具的研究和应用,然后对当前主流个性化搜索引擎的相关原理及应用作了理论性介绍,重点对个性化信息的采集和更新进行了分析,为下一步的研究改进打下基础。 2、针对个性化搜索引擎存在的不足和问题,提出了一种全新的个性化搜索引擎思想即群体个性化搜索技术。通过分析比较相关数据,对群体化搜索引擎的应用进行了可行性和服务性的分析。整体结构设计上采用客户端-服务器模式,对群体个性化搜索引擎进行系统实现,重点介绍了群体个性化搜索引擎几个重要模型的设计与实现,如用户模型的设计与实现,个性化查询扩展模块,个性化排序模块等。 3、在系统实现的基础上,分别与传统搜索引擎及个性化搜索引擎进行了搜索结果比较,分析了群体个性化搜索引擎的优缺点。 本文的研究内容将为个性化搜索引擎指出一个全新的发展方向,为搜索引擎的进一步发展提供一个新的理论平台和开端。
【学位授予单位】:武汉理工大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.3

【引证文献】
中国硕士学位论文全文数据库 前3条
1 许建豪;打折商品搜索引擎的设计与实现[D];广西大学;2011年
2 陈俊生;数据中心业务管理系统中信息检索技术的研究[D];北京林业大学;2012年
3 朱健琛;个性化新闻搜索引擎的研究与设计[D];电子科技大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 张晓刚,李明树;智能搜索引擎技术的研究与发展[J];计算机工程与应用;2001年24期
2 曹元大,贺海军,涂哲明,王琴;全文检索字索引技术的研究与实现[J];计算机工程;2002年06期
3 印鉴,陈忆群,张钢;搜索引擎技术研究与发展[J];计算机工程;2005年14期
4 李志蜀,李果;中文搜索引擎的原理剖析及开发实现技术[J];计算机应用研究;2001年11期
5 颜维龙,盖杰,武港山,袁春风;面向网络的全文检索中索引文件的组织[J];计算机应用研究;2002年11期
6 张晓卫;朱巧明;;一种基于Lucene的Web全文信息检索系统的设计与实现[J];计算机与现代化;2006年12期
7 管建和;甘剑峰;;基于Lucene全文检索引擎的应用研究与实现[J];计算机工程与设计;2007年02期
8 余艳;搜索引擎原理剖析及其技术发展[J];图书馆学刊;2004年01期
9 胡吉明;;个性化搜索引擎中的用户兴趣提取技术[J];图书馆学刊;2006年04期
10 朱前东;庞弘燊;;搜索引擎个性化检索研究综述[J];图书馆学刊;2008年06期
中国博士学位论文全文数据库 前4条
1 吴丽辉;个性化的Web信息采集技术研究[D];中国科学院研究生院(计算技术研究所);2005年
2 许洪波;大规模信息过滤技术研究及其在Web问答系统中的应用[D];中国科学院研究生院(计算技术研究所);2003年
3 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
4 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
中国硕士学位论文全文数据库 前3条
1 刘妮娜;Web数据挖掘和个性化搜索引擎研究[D];浙江大学;2005年
2 吴海明;基于Lucene的搜索引擎技术的研究与改进[D];暨南大学;2006年
3 谢彬;个性化元搜索引擎的研究与实现[D];内蒙古科技大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 陈基漓;牛秦洲;;WEB挖掘在农业信息网站个性化服务中的应用[J];安徽农业科学;2008年35期
2 朱学芳;冯曦曦;;面向农业主题搜索引擎设计与实现[J];安徽农业科学;2011年35期
3 季元叶;;服务发现体系架构发展现状及新架构的研究[J];办公自动化;2012年10期
4 郭力军;朱群雄;;基于RSS数据源的用户兴趣模型改进及应用[J];北京化工大学学报(自然科学版);2011年01期
5 汪涛,樊孝忠,顾益军,刘林;基于概念分析的主题爬虫设计[J];北京理工大学学报;2004年10期
6 贺胜;卢亚军;;面向大规模语料库的全文检索系统研究[J];图书与情报;2008年04期
7 陈治昂;张毅;李大学;;基于Web智能的网络广告监测器研究与设计[J];重庆邮电大学学报(自然科学版);2009年01期
8 丛荣华;;网络教育中的数据收集技术[J];长春师范学院学报;2006年10期
9 满鹏;;海量文档信息的高效检索算法[J];长春大学学报;2008年02期
10 尚冬娟;张敏;;信息过滤系统中的混合式过滤算法[J];重庆工学院学报(自然科学版);2008年01期
中国重要会议论文全文数据库 前10条
1 杨卫明;;独立式搜索引擎原理及存在问题分析[A];2008年计算机应用技术交流会论文集[C];2008年
2 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
3 李明宙;罗艳;王宗义;;Lucene全文检索引擎的研究及应用[A];广西计算机学会2010年学术年会论文集[C];2010年
4 曹红;袁津生;;多领域主题搜索引擎研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
5 朱广飞;董超;王衡;汪国平;;照片标签的智能化管理[A];第四届和谐人机环境联合学术会议论文集[C];2008年
6 马焱;彭立;;个性化基础教育搜索引擎用于个性化教学的研究[A];信息技术环境构建与教学应用[C];2009年
7 刘雪芹;齐大朝;;基于robot的全文搜索引擎原理剖析[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
8 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
9 张赪军;刘祥瑞;李军;黄红梅;;基于本体的语义检索技术研究[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
10 张赪军;黄红梅;王晨熙;李军;;构建智能信息检索系统[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年
2 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
3 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
4 张宏斌;信息获取中的两类不确定问题研究[D];华中科技大学;2004年
5 金燕;WWW信息导航机制研究[D];武汉大学;2005年
6 南凯;面向关系型数据共享的数据网格中间件研究[D];中国科学院研究生院(计算技术研究所);2006年
7 刘甲学;超媒体信息空间智能导航理论与实证研究[D];吉林大学;2006年
8 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
9 颜端武;面向知识服务的智能推荐系统研究[D];南京理工大学;2007年
10 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 程宾;基于用户兴趣模型的元搜索引擎的研究[D];山东科技大学;2010年
2 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
3 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
4 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
5 刘靖媛;个性搜索引擎中用户兴趣模型研究[D];哈尔滨工程大学;2010年
6 汪永伟;搜索引擎中网页排序算法的研究与实现[D];哈尔滨工程大学;2010年
7 孙原;基于酉变换的权威页面挖掘算法研究[D];哈尔滨工程大学;2010年
8 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年
9 朱莹婷;基于迁移学习理论的Markov检索模型[D];江西师范大学;2010年
10 丛肖为;敏感信息监管系统的设计与实现[D];华东师范大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 胡锡衡;;正向最大匹配法在中文分词技术中的应用[J];鞍山师范学院学报;2008年02期
2 武旭,须德;基于向量空间模型的文本自动分类系统的研究与实现[J];北方交通大学学报;2003年02期
3 万春;王健;;基于MVC设计模式的Struts框架研究与实现[J];电脑学习;2010年03期
4 罗文雄,卢少娟;浅谈大型数据中心建设[J];广东公安科技;2005年01期
5 单丽莉;刘秉权;孙承杰;;文本分类中特征选择方法的比较与改进[J];哈尔滨工业大学学报;2011年S1期
6 胡师彦;XML原理与应用[J];哈尔滨商业大学学报(自然科学版);2001年04期
7 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期
8 林鸿飞;基于Web的信息过滤机制[J];计算机工程与应用;2002年02期
9 谭琼,史忠植;分词中的歧义处理[J];计算机工程与应用;2002年11期
10 陈燕娜,邵志清;基于全文搜索的中文搜索引擎设计技术[J];计算机工程与应用;2002年17期
中国硕士学位论文全文数据库 前10条
1 李海升;垂直搜索引擎的研究与实现[D];西安电子科技大学;2009年
2 董平;关联特征提取与贝叶斯网络的文本分类研究[D];华南理工大学;2011年
3 陈鑫卿;搜索引擎技术中的Web结构挖掘算法研究[D];山西大学;2003年
4 胡小睿;基于Web挖掘的搜索引擎技术研究[D];武汉大学;2005年
5 张敏;基于Internet的个性化信息检索关键技术研究[D];燕山大学;2006年
6 姚建绩;基于XML的搜索引擎研究[D];西安科技大学;2006年
7 时金峰;基于XML的站内搜索引擎研究[D];华东师范大学;2007年
8 吴卓斌;基于LUCENE全文搜索引擎关键技术的研究[D];暨南大学;2007年
9 苏雪峰;隐交互式个性化搜索引擎研究[D];太原理工大学;2007年
10 张艳;Web挖掘在搜索引擎个性化中的应用研究[D];合肥工业大学;2008年
【二级参考文献】
中国期刊全文数据库 前10条
1 雷鸣,王建勇,赵江华,单松巍,陈葆珏;第三代搜索引擎与天网二期[J];北京大学学报(自然科学版);2001年05期
2 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
3 李晓明;对中国曾有过静态网页数的一种估计[J];北京大学学报(自然科学版);2003年03期
4 张付志,刘明业;一种基于元搜索引擎的数字图书馆系统集成框架[J];北京理工大学学报;2004年08期
5 马燕,邹显春,包骏杰,李明;一种互联网智能元搜索引擎模型的设计[J];重庆师范大学学报(自然科学版);2004年03期
6 李粤;安捷;李星;;排序融合算法在校园网搜索引擎中的应用[J];大连理工大学学报;2005年S1期
7 薛云,陈俊杰;Internet上有关元搜索引擎的研究与设计[J];电脑开发与应用;2003年04期
8 虞强源,刘大有,欧阳继红;基于区间值模糊集的模糊区域拓扑关系模型[J];电子学报;2005年01期
9 吕传宇,李华,耿虎;一种适合于专题式元搜索引擎的信息检索策略[J];重庆大学学报(自然科学版);2004年07期
10 陈建秋,邓飞其,刘发贵;智能化搜索引擎分析与探讨[J];广州大学学报(自然科学版);2002年03期
中国博士学位论文全文数据库 前5条
1 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
2 何军;Internet中多媒体信息过滤技术的研究[D];电子科技大学;2002年
3 李四明;基于智能Agent的网上农业信息挖掘研究[D];中国农业大学;2003年
4 胡鹤;本体方法及其时空推理应用研究[D];吉林大学;2004年
5 杜亚军;搜索引擎智能行为的研究及实现[D];西南交通大学;2005年
中国硕士学位论文全文数据库 前10条
1 易靖;基于信息粒度原理的文本分类方法的研究[D];北京工业大学;2001年
2 郭琰;元搜索引擎的关键技术研究及系统实现[D];南京理工大学;2002年
3 李勇;智能检索中基于本体的个性化用户建模技术及应用[D];国防科学技术大学;2002年
4 代学武;基于神经网络的用户建模和Web信息过滤研究[D];西南师范大学;2003年
5 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年
6 杨凤芹;建立层次结构用户兴趣模型的方法[D];东北师范大学;2004年
7 李益;基于多Agent的智能搜索引擎系统研究[D];哈尔滨工程大学;2004年
8 刘妮娜;Web数据挖掘和个性化搜索引擎研究[D];浙江大学;2005年
9 王洪英;基于区间值模糊集的模糊综合评判[D];山东大学;2005年
10 李淑静;基于内容的垃圾邮件过滤研究与实现[D];南京信息工程大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 王学辉;金丹;;Lucene与关系型数据库对比[J];电脑知识与技术(学术交流);2007年03期
2 李武装;;基于语义的企业搜索引擎的研究与实现[J];电脑知识与技术(学术交流);2007年08期
3 喻金平;谭鸣;夏小云;;基于Lucene技术的垂直搜索引擎的研究[J];软件导刊;2008年03期
4 朱海丰;秦杰;;基于Lucene与JSF的搜索引擎[J];福建电脑;2008年10期
5 申剑;鲍春燕;;基于Lucene的搜索策略研究[J];现代计算机(专业版);2008年12期
6 李永春;丁华福;;Lucene的全文检索的研究与应用[J];计算机技术与发展;2010年02期
7 任惠静;;基于Lucene的面向主题搜索引擎的索引技术的研究[J];电脑知识与技术;2010年04期
8 侯云;;构建基于Lucene的网站站内搜索[J];信息与电脑(理论版);2010年02期
9 贺胜;;基于Lucene的中文全文检索系统[J];中国高校科技与产业化;2006年S3期
10 刘建湘;杨文涛;;基于Lucene的搜索引擎在Struts中的应用[J];软件导刊;2007年03期
中国重要会议论文全文数据库 前10条
1 李明宙;罗艳;王宗义;;Lucene全文检索引擎的研究及应用[A];广西计算机学会2010年学术年会论文集[C];2010年
2 申兵一;巩青歌;;基于Lucene桌面搜索引擎系统的设计和实现[A];江苏省电子学会2010年学术年会论文集[C];2010年
3 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
4 戴莉;周明全;武仲科;王永恒;王燕妮;周曼;;Lucene在智能答疑系统中的应用研究[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
5 刘源;詹舒波;;基于Solr的行业垂直搜索平台的研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
6 刘寿强;;基于Lucene的分级鉴权企业搜索引擎研究与设计[A];第二十一次全国计算机安全学术交流会论文集[C];2006年
7 ;Web搜索引擎原理与应用[A];四川省通信学会2005年学术年会论文集[C];2005年
8 王富强;马德涛;张立朝;王建明;;地方志数据库全文信息检索研究[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年
9 苏毅;王文力;阎姗;邓峰;;基于Ajax技术信息动态查询的设计与实现[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
10 苏亮;孙斌;;一种基于Lucene的Hash改进中文分词算法的实现[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
中国硕士学位论文全文数据库 前10条
1 王冬坡;基于Lucene的主题搜索引擎的研究与实现[D];河北科技大学;2010年
2 张彬;基于lucene的搜索引擎[D];上海师范大学;2010年
3 高欣;基于Lucene的全文检索系统的研究与实现[D];天津师范大学;2010年
4 闻峥;基于Lucene的搜索引擎优化[D];北京交通大学;2011年
5 杜先撰;基于Lucene全文索引系统设计与实现[D];南京大学;2011年
6 周月红;基于Lucene的站内搜索引擎的设计与开发[D];华东理工大学;2011年
7 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
8 陈航哲;基于Lucene的垂直搜索引擎的研究与应用[D];暨南大学;2010年
9 岳莉;基于Lucene的全文检索系统的研究与应用[D];西安电子科技大学;2010年
10 苏景春;基于Lucene的全文检索系统的研究与应用[D];北京交通大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026