收藏本站
《华东师范大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

分布式信息检索引擎的分析与实现

赵联冠  
【摘要】: 建立计算机网络的主要目的是为了共享数据资源,为了提高资源共享水平和检索速度,目前网络上提供大量可实现共享资源的服务器,并以Web服务的方式供用户和其它服务器访问。然而,由于存在共享服务器分布区域广,数量多等诸多问题,使得用户很难及时检索到所需信息。为了解决这一问题,论文提出了基于分布式技术的资源检索方法。其中心思想是:当用户通过任何一台服务器检索数据信息时,除从本地检索信息以外,服务器还充当客户端角色,自动连接到其它服务器实施信息检索,并将得到的检索结果合并汇总并返回给最终用户。 基于上述思想,本文研发了一个基于分布式技术的信息检索引擎,该引擎使用的网络环境要求是,网络中每一台机器均可作为Web服务器,且每台服务器上均按一定方式保存了大量共享信息,这些共享信息资源以xml文档格式存放在服务器的根目录下。 当用户登陆到网络中任何一台服务器并发出检索要求时,均可检索到所在服务器及与该服务器连接的所有服务器可供检索的资源信息,即以XML格式存放的文档信息。除具有一般搜索功能外,该系统还具有按用户指定要求搜索相应资源等较高级搜索功能,如,用户可设置要搜索资源的类型、上传时间等。除此之外,系统对搜索结果显示做了进一步设计,既可以按Word、PPT等文档格式预览资源,又可以在线播放音频、视频资源;既可以通过点击检索出的资源名称下载所需资源,也可以对相应内容评分或评论。为了增加安全性,系统设置了用户注册等功能,通过设置了普通用户和管理员两种登录权限,既保证了系统安全,也方便了系统后台的管理与维护。 实践证明,本论文研发的分布式信息检索引擎具有较高的检索性能和准确率。
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.3

【引证文献】
中国硕士学位论文全文数据库 前1条
1 李兴芳;校园社区服务平台的设计与研究[D];河北农业大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
2 陈燕娜,邵志清;基于全文搜索的中文搜索引擎设计技术[J];计算机工程与应用;2002年17期
3 沈记全,唐菁,杨炳儒;Web文本挖掘系统及其分类算法的研究与实现[J];计算机工程;2003年17期
4 马玉春,宋瀚涛;Web中文文本分词技术研究[J];计算机应用;2004年04期
5 潘春华 ,常敏 ,武港山;面向Web的信息收集工具的设计与开发[J];计算机应用研究;2002年06期
6 辛萌;;网络环境下的信息检索[J];科技信息;2008年26期
7 黄萱菁;吴立德;;基于向量空间模型的文档分类系统[J];模式识别与人工智能;1998年02期
8 宋聚平,王永成,滕伟,许欢庆;搜索引擎中Robot搜索算法的优化[J];情报学报;2002年02期
9 傅欣;第三代搜索引擎的智能化趋势研究[J];现代图书情报技术;2002年06期
10 张云涛,龚玲,王永成;An improved TF-IDF approach for text classification[J];Journal of Zhejiang University Science A(Science in Engineering);2005年01期
中国硕士学位论文全文数据库 前7条
1 刘向辉;专题性智能搜索引擎的研究与实现[D];昆明理工大学;2001年
2 侯震宇;主题型搜索引擎的研究与实现[D];中国科学院研究生院(文献情报中心);2003年
3 常晓燕;基于Java的新闻搜索引擎的设计与实现[D];西南交通大学;2004年
4 吴东华;Web信息获取技术研究[D];南京理工大学;2004年
5 黄国景;元搜索引擎个性化搜索的研究与设计[D];苏州大学;2005年
6 胡小睿;基于Web挖掘的搜索引擎技术研究[D];武汉大学;2005年
7 何世林;基于Java技术的搜索引擎研究与实现[D];西南交通大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 孙素芬;罗长寿;张峻峰;于峰;张树亮;;农业信息资源整合系统研究与应用[J];安徽农业科学;2007年22期
2 汪斌;张云伟;刘健;陈晶;;一种面向农业信息主题网络爬虫的设计[J];安徽农业科学;2009年20期
3 王洪德;张俊;;基于角改进的城市交通网络实时最短路径算法研究[J];安全与环境学报;2009年03期
4 于江德;王希杰;;词位标注汉语分词技术详解[J];安阳师范学院学报;2010年05期
5 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期
6 朱华;浅谈网络信息资源采集技术[J];国家图书馆学刊;2004年02期
7 汪涛,樊孝忠,顾益军,刘林;基于概念分析的主题爬虫设计[J];北京理工大学学报;2004年10期
8 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
9 陈治昂;张毅;李大学;;基于Web智能的网络广告监测器研究与设计[J];重庆邮电大学学报(自然科学版);2009年01期
10 丛荣华;;网络教育中的数据收集技术[J];长春师范学院学报;2006年10期
中国重要会议论文全文数据库 前10条
1 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 余骁捷;邵阳;吴及;王侠;;基于SVM和MMR融和的自动文摘方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 杨卫明;;独立式搜索引擎原理及存在问题分析[A];2008年计算机应用技术交流会论文集[C];2008年
4 曾华琳;史晓东;李堂秋;;基于上下文信息提取的概率分词算法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
5 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
6 杨红;易高流;;网络环境中雷电防护信息利用[A];闽、浙、赣、皖毗邻地区军队地方气象联防协会学术交流会论文集[C];2005年
7 戴祖旭;洪帆;;基于词性标记文法的文本信息隐藏算法[A];第四届中国软件工程大会论文集[C];2007年
8 张霄军;;“长安”的同名地名自动识别与指代消解[A];陕西省社会科学界第二届(2008)学术年会——青年博士论坛“陕西新起点:创新·发展·民生”专题获奖论文选编[C];2008年
9 柏桂荣;章勇;;基于RSS的用户兴趣模型研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
10 邹永斌;陈兴蜀;王文贤;;一个高性能Web资源收集系统的设计与实现[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
中国博士学位论文全文数据库 前10条
1 陈曦;基于子串的文本分割与主题标注研究[D];武汉大学;2009年
2 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
3 吴戈;基于数字水印的文本信息隐藏方法的研究[D];长春理工大学;2011年
4 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
5 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
6 朱锁玲;命名实体识别在方志内容挖掘中的应用研究[D];南京农业大学;2011年
7 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
8 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
9 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
10 张蕾;概念结构及其应用[D];西北工业大学;2001年
中国硕士学位论文全文数据库 前10条
1 岳广飞;基于二次搜索的搜索引擎技术研究[D];山东科技大学;2010年
2 冯海瑛;《万历野获编》分词理论与实践[D];广西师范学院;2010年
3 刘婧一;元代笔记分词理论与实践[D];广西师范学院;2010年
4 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
5 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
6 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
7 孙原;基于酉变换的权威页面挖掘算法研究[D];哈尔滨工程大学;2010年
8 吴迪;高校毕业生就业推荐系统的设计与开发[D];大连理工大学;2010年
9 王东亮;基于条件随机场模型的中文人名识别的研究[D];大连理工大学;2010年
10 廖文平;基于CRF的中文地名识别研究[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 万畅;“以物易物”重新焕发生机[J];财会月刊;2000年23期
2 刘磊安;符志强;;基于Lucene.net网络爬虫的设计与实现[J];电脑知识与技术;2010年08期
3 张彦;;网络易物模式中存在的问题探讨[J];四川工程职业技术学院学报;2008年03期
4 王嘉琦;;浅谈我国C2C换物网站的发展现状[J];电子商务;2011年06期
5 刘甫;;校园易物网站的设计及在校园中的实现[J];河南科技;2011年17期
6 武毅;钟志农;;基于Lucene.Net的安全信息系统全文检索引擎的设计与实现[J];计算机与信息技术;2011年Z2期
7 张晓刚,李明树;智能搜索引擎技术的研究与发展[J];计算机工程与应用;2001年24期
8 陈燕娜,邵志清;基于全文搜索的中文搜索引擎设计技术[J];计算机工程与应用;2002年17期
9 李勇;韩亮;;主题搜索引擎中网络爬虫的搜索策略研究[J];计算机工程与科学;2008年03期
10 潘春华 ,常敏 ,武港山;面向Web的信息收集工具的设计与开发[J];计算机应用研究;2002年06期
中国重要报纸全文数据库 前1条
1 杜琴庆;[N];江苏经济报;2006年
中国硕士学位论文全文数据库 前2条
1 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
2 周旋;论SNS网站及其本土化[D];湖南师范大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 戴先宇,王明文,吴水秀,张石林;带参数的搜索引擎[J];江西师范大学学报(自然科学版);2002年04期
2 王卫国;冲浪第二代检索引擎[J];电脑技术;2000年03期
3 康桂英,刘春平;新一代中文智能搜索引擎研究[J];东南大学学报(哲学社会科学版);2002年S1期
4 孙莉苹,张永奎;网上信息检索中BOT站点爬行方法[J];电脑开发与应用;2001年10期
5 叶允明,于水,马范援,宋晖,张岭;分布式Web Crawler的研究:结构、算法和策略[J];电子学报;2002年S1期
6 苏云;搜索引擎Google检索技巧研究[J];甘肃科技;2005年02期
7 刘挺,吴岩,王开铸;最大概率分词问题及其解法[J];哈尔滨工业大学学报;1998年06期
8 王奇,宋国新,邵志清;信息检索中基于链接的网页排序算法[J];华东理工大学学报;2000年05期
9 王继成,邹涛,杨小江,潘金贵,张福炎;基于Internet的信息资源发现技术与实现[J];计算机研究与发展;1999年11期
10 张卫丰,徐宝文;Web搜索引擎框架研究[J];计算机研究与发展;2000年03期
中国重要会议论文全文数据库 前1条
1 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前1条
1 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
中国硕士学位论文全文数据库 前8条
1 陈小宁;Web信息资源获取技术的研究与实现[D];暨南大学;2001年
2 刘向辉;专题性智能搜索引擎的研究与实现[D];昆明理工大学;2001年
3 王胜海;网络智能知识服务系统设计与实现[D];中国科学院研究生院(文献情报中心);2002年
4 张俭恭;扩展元搜索引擎(EMSE)的系统设计[D];中国科学院研究生院(文献情报中心);2002年
5 许林杰;中文文本分词研究[D];山东师范大学;2003年
6 王晓华;基于内容的搜索引擎技术研究及其应用[D];郑州大学;2005年
7 刘壁松;策略可扩展的搜索引擎研究和实现[D];清华大学;2005年
8 史锦荣;基于多Agent智能搜索引擎模型研究[D];太原理工大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 大千;分布式信息检索[J];国家图书馆学刊;2004年02期
2 韩立新,陆桑璐,谢立;一个面向Internet的分布式信息检索系统模型[J];电子学报;2002年08期
3 郭少友;基于XML的分布式信息检索[J];现代图书情报技术;2003年02期
4 钟荣;;基于XML的移动Agent搜索引擎[J];中国水运(理论版);2006年05期
5 张刚;周昭涛;王斌;;基于主题的分布式信息检索技术研究[J];计算机工程;2006年12期
6 曲卫红;;基于移动agent的分布式信息检索的研究[J];现代情报;2006年01期
7 张刚;郭岩;张凯;;分布式信息检索的集合选择研究[J];计算机工程;2007年02期
8 张刚;谭建龙;;分布式信息检索中文档集合划分问题的评价[J];软件学报;2008年01期
9 于庆梅;雷景生;黄冬梅;池涛;;基于Agent的分布式信息检索系统[J];计算机工程;2006年17期
10 张刚;王斌;吴丽辉;;基于链接划分的分布式WEB信息检索[J];模式识别与人工智能;2007年04期
中国重要会议论文全文数据库 前10条
1 张刚;周昭涛;王斌;;基于主题的分布式信息检索研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 张刚;刘悦;;基于查询空间的分布式文档集合划分算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 王得天;洪光辉;杜登惠;王聪昌;;预测引擎盖过关量的仿真分析[A];第七届中国CAE工程分析技术年会暨2011全国计算机辅助工程(CAE)技术与应用高级研讨会论文集[C];2011年
4 孟广平;;企业服务器群网络高可用性设计探讨[A];中国计量协会冶金分会2009年年会论文集[C];2009年
5 金狮;杨河洲;苏秀荣;;Y43车型引擎盖外板开口区域怠速振动的问题解析及设计改进[A];第七届河南省汽车工程科技学术研讨会论文集[C];2010年
6 伍慧玲;;乡村旅游:农业产业化的新引擎[A];推动新型工业化 促进湖南经济发展——2007年湖南科技论坛(下)[C];2007年
7 葛利辉;王坚;;基于B/S结构的轻量级工作流引擎的设计[A];系统仿真技术及其应用(第7卷)——'2005系统仿真技术及其应用学术交流会论文选编[C];2005年
8 缪纶;叶茂;;基于Java的Web统计图表引擎的设计与实现[A];水力学与水利信息学进展 2009[C];2009年
9 曹国峰;;三维GIS渲染引擎中关键技术探讨[A];中国地理信息系统协会第三次代表大会暨第七届年会论文集[C];2003年
10 戴斌;孙志刚;卢泽新;;基于DMA引擎的高速网卡的性能分析[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
中国重要报纸全文数据库 前10条
1 飞思卡尔半导体公司汽车和标准产品部Johann Holzmann;利用高速缓存体系结构进行汽车引擎嵌入式控制[N];中国电子报;2005年
2 本栏目文章由 李新辑;从保养中“省”出油钱[N];中国消费者报;2004年
3 本报记者 姜圣瑜 陆峰;开放型经济是江苏大发展的引擎[N];新华日报;2003年
4 金朝力;商业引擎助力中小网游腾飞[N];北京商报;2007年
5 徐光亚;“乡村公路网”成为北渡镇项目建设“引擎”[N];中国特产报;2007年
6 春耕;“双引擎”驱动下的投资机会[N];中国证券报;2006年
7 东方证券 周凤武;振华港机 增长引擎崭露头角[N];中国证券报;2007年
8 本报记者 贺遐;以引擎号令天下[N];中国体育报;2006年
9 陈峰;研华公司启动“4+1成长引擎”[N];国家电网报;2008年
10 本报评论员;打造追赶跨越的新引擎[N];牡丹江日报;2008年
中国博士学位论文全文数据库 前10条
1 何川;分布式信息检索中的若干重要问题研究[D];北京邮电大学;2012年
2 王秀红;文本相似度计算核函数的构造及其在分布式信息检索中的应用研究[D];江苏大学;2012年
3 薛云皎;基于智能主体的分布式构件库相关技术研究[D];复旦大学;2006年
4 曲朝阳;智能电网知识可视化引擎的研究[D];华北电力大学(河北);2010年
5 向桂林;XML引擎研究[D];中国科学院研究生院(文献情报中心);2004年
6 马骏;基于智能化身的移动虚拟现实技术及其应灾导航应用研究[D];北京交通大学;2007年
7 杨鹏;面向事件感知的应急临机决策引擎研究[D];天津大学;2010年
8 郑建国;大型天然气管网仿真计算引擎的研究与实现[D];西南石油大学;2012年
9 张宇;个性化移动内容服务的模型和支持技术研究[D];华中科技大学;2010年
10 史斌;面向语义网的语义搜索引擎关键技术研究[D];北京工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 赵联冠;分布式信息检索引擎的分析与实现[D];华东师范大学;2010年
2 李伟峰;基于网格的分布式信息检索技术研究[D];武汉理工大学;2010年
3 陈斌;分布式信息检索结果融合算法的研究及实现[D];华南理工大学;2011年
4 谢照莉;基于Hadoop的机械故障诊断资源分布式信息检索系统的设计与实现[D];湖南科技大学;2011年
5 郭松青;支持用户定制的IT服务管理流程引擎的设计与实现[D];北京邮电大学;2011年
6 熊西满;基于3D图形引擎的雾化渲染方法及实现[D];电子科技大学;2010年
7 刘德建;基于引擎模式的三维巷道漫游系统的设计与实现[D];河南理工大学;2010年
8 滕飞;工作流管理系统中引擎控制器的研究与实现[D];中国科学院研究生院(沈阳计算技术研究所);2010年
9 乔云从;柔性流程引擎的设计与实现[D];浙江大学;2011年
10 魏磊;基于构件技术的通用工作流引擎设计[D];河北大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026