收藏本站
《清华大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

分布式系统中的文本信息检索技术研究

刘红星  
【摘要】:随着网络技术的发展和应用,企业网和互联网的信息量都在不断地急剧增长,其中包含了大量简单文本类型的原始未分类数据。为了能对这一庞大的数据空间进行有效的数据检索以迅速准确地获得所需数据,必须建立网络环境下的分布式信息检索系统。一个性能优良的分布式信息检索系统应能提供分布性、并发工作性、协同工作性和高效性。 本文主要通过尝试建立一个基于网络技术和分类技术的分布式信息检索系统,致力于提高多用户并发环境下的信息检索效率。目前,网络技术的迅猛发展为海量信息的分布应用创造了条件;检索理论的发展完善也使得信息检索研究可以在较高的层次进行。本文以之为基础,主要研究文本信息的特征抽取,信息特征的归类,网络任务的分布管理,以及分布式信息检索系统的合理体系结构。本文的主要成果在于,提出了虚拟文档分类技术和信息特征的向量表示以及相似性算法,并建立了一个实际意义上的分布式信息检索系统原型。
【学位授予单位】:清华大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:TP391.3

【引证文献】
中国期刊全文数据库 前1条
1 焦玉英;宋晓晴;;基于VSM的文档信息检索改进[J];情报理论与实践;2007年01期
中国硕士学位论文全文数据库 前1条
1 付志超;基于Map/Reduce的分布式智能搜索引擎框架研究[D];武汉理工大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 王玮,张德龙;一种新的模糊控制器电路设计[J];安徽大学学报(自然科学版);1998年04期
2 高迎,王丽君,王锡钢;Simutem:一个中文信息检索系统[J];鞍山师范学院学报;2001年03期
3 郭忠伟;桑殿伟;郑华利;李洪峰;;军用文书自动生成中表层实现的概率模型[J];兵工自动化;2010年11期
4 郭庆琳,樊孝忠;知识信息搜索和获取技术的研究[J];北京工业大学学报;2003年04期
5 骆正华,樊孝忠,刘林,龚永罡;基于E-Chunk的问句实例分析系统[J];北京理工大学学报;2005年01期
6 郭庆琳,樊孝忠,柳长安;基于文本聚类和NLU的自动文摘研究[J];北京理工大学学报;2005年08期
7 徐朝伦,王晓湘,柯有安;基于子波变换的纹理图像的多级分割[J];北京理工大学学报;1998年04期
8 赵衍运,蔡安妮,孙景鳌;基于模糊的核医学心脏门控图像左心室边缘自动检测[J];北京邮电大学学报;2001年03期
9 明均仁;张帆;;网络文本信息过滤的意义及其模型初探[J];图书与情报;2007年04期
10 荣雅君,王莉丽;模糊聚类分析在变压器保护中的应用[J];变压器;2003年09期
中国重要会议论文全文数据库 前4条
1 索继东;刘人杰;杨广治;;基于模糊聚类的雷达与GPS的数据融合[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
2 田馨;;人工智能技术与模糊推理[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
3 王连亮;陈怀新;;雷达辐射源的自适应数据关联方法[A];中国雷达行业协会航空电子分会暨四川省电子学会航空航天专委会学术交流会论文集[C];2005年
4 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
中国博士学位论文全文数据库 前10条
1 赖军臣;基于病症图像的玉米病害智能诊断研究[D];石河子大学;2010年
2 孙中皋;无线传感器网络能量高效路由协议研究[D];大连海事大学;2011年
3 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
4 侯格贤;遗传算法及其在跟踪系统中的应用研究[D];西安电子科技大学;1998年
5 范九伦;模糊聚类新算法与聚类有效性问题研究[D];西安电子科技大学;1998年
6 梁继民;多传感器决策融合方法研究[D];西安电子科技大学;1999年
7 王晓丹;基于模糊聚类及神经网络的纹理分割方法研究[D];西北工业大学;2000年
8 沈明霞;自主行走农业机器人视觉导航信息处理技术研究[D];南京农业大学;2001年
9 袁华;肺癌介入治疗的图象处理和模拟实验研究[D];四川大学;2001年
10 卢学军;汽轮发电机组故障诊断系统中几个关键技术的研究[D];浙江大学;2001年
中国硕士学位论文全文数据库 前10条
1 史大运;胶州湾适航资源分析及航道通航环境安全综合评价[D];中国海洋大学;2010年
2 周登;基于N-Gram模型的藏文文本分类技术研究[D];西北民族大学;2010年
3 郭敬;基于分割的医学图像检索技术研究[D];山东师范大学;2011年
4 姚克贺;隧道衬砌病害关联性研究及安全性评定设计[D];北京交通大学;2011年
5 王作飞;基于粗糙集的启发式属性约简特征选择方法研究[D];郑州大学;2011年
6 王园园;以动词为逻辑驱动的中文信息处理系统的建设[D];成都理工大学;2011年
7 李娟;燃醇基燃料锅炉燃烧系统优化建模与智能控制研究[D];湖南大学;2009年
8 蒋子海;基于元信息的文本分类与优化技术研究与实现[D];国防科学技术大学;2010年
9 陈香香;云计算中MapReduce性能优化及应用[D];重庆大学;2011年
10 钟迎春;基于模糊粗糙集的遥感图像土地利用区域多中心分类法[D];湖南科技大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 曹元大,贺海军,涂哲明;中文Web文档全文检索系统的设计及实现[J];北京理工大学学报;2002年01期
2 侯孟书,卢显良,周旭,詹川;非结构化P2P系统的路由算法[J];电子科技大学学报;2005年01期
3 岳清;浅析搜索引擎的原理及发展前景[J];大众科技;2005年05期
4 王建勇,谢正茂,雷鸣,李晓明;近似镜像网页检测算法的研究与评价[J];电子学报;2000年S1期
5 胡双双;秦杰;;搜索引擎技术及其发展趋势[J];福建电脑;2008年06期
6 苏云;搜索引擎Google检索技巧研究[J];甘肃科技;2005年02期
7 陈建秋,邓飞其,刘发贵;智能化搜索引擎分析与探讨[J];广州大学学报(自然科学版);2002年03期
8 张元丰;董守斌;张凌;陈晓志;;基于Map/Reduce的网页消重并行算法[J];广西师范大学学报(自然科学版);2007年02期
9 张卫丰,徐宝文;Web搜索引擎框架研究[J];计算机研究与发展;2000年03期
10 钟涛,陈新明,万钧,张世永;中文文本WEB搜索引擎的设计与实现[J];计算机工程与应用;2001年17期
中国博士学位论文全文数据库 前1条
1 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
中国硕士学位论文全文数据库 前7条
1 皮鹏;智能搜索引擎系统的研究[D];哈尔滨工程大学;2002年
2 陈魁;智能搜索引擎系统的分析设计与开发[D];大连理工大学;2004年
3 凌海云;基于语义网的智能搜索技术的研究与实现[D];电子科技大学;2004年
4 吴平博;基于事件框架的主题相关文档智能检索的初步研究[D];清华大学;2004年
5 杭月芹;基于文档查询信息的检索系统研究与实现[D];扬州大学;2005年
6 沈斌;基于分词的中文文本相似度计算研究[D];天津财经大学;2006年
7 潘照明;智能中文搜索引擎若干关键技术的研究与实现[D];浙江大学;2006年
【二级引证文献】
中国期刊全文数据库 前4条
1 谌超;强保华;石龙;;基于Hadoop MapReduce的大规模数据索引构建与集群性能分析[J];桂林电子科技大学学报;2012年04期
2 张玉芳;梁琪;熊忠阳;肖婷;;结合仿射几何和正交分解的类中心分类法研究[J];计算机工程与应用;2010年23期
3 熊忠阳;李智星;张玉芳;江帆;;基于正交分解的文本分类模型[J];计算机工程;2009年14期
4 张成伟;郑诚;;基于改进VSM的文本信息检索研究[J];计算机技术与发展;2009年01期
中国博士学位论文全文数据库 前2条
1 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
2 方雷;基于云计算的土地资源服务高效处理平台关键技术探索与研究[D];浙江大学;2011年
中国硕士学位论文全文数据库 前10条
1 么士宇;基于分布式计算的网络爬虫技术研究[D];大连海事大学;2011年
2 蒋明原;云计算平台在搜索引擎中的关键技术研究[D];中北大学;2011年
3 陈璐;基于云计算的海量数据存储技术的研究及应用[D];武汉科技大学;2011年
4 宫彦磊;基于云计算的车载GPS导航终端的研究与设计[D];延边大学;2011年
5 白冰;基于多层向量空间的语义信息检索研究[D];重庆大学;2011年
6 李海波;基于MapReduce框架的分布式网络爬行器研究[D];哈尔滨工程大学;2011年
7 艾明;面向海量数据的云存储系统实现与应用研究[D];南京理工大学;2012年
8 李元洪;基于反馈的动态负载平衡调度算法在Hadoop异构环境中的设计与实现[D];南京理工大学;2012年
9 冯斌;基于Lucene小型搜索引擎的研究与实现[D];武汉理工大学;2008年
10 张志田;无监督关系抽取方法研究[D];哈尔滨工业大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 陶跃华;鲁晓南;张玉琢;;一种瘦服务器—胖客户分布式搜索引擎的设计[J];广西师范大学学报(自然科学版);2007年02期
2 邱君瑞;耿亦兵;;医学网络信息检索的研究热点[J];图书馆杂志;2003年06期
3 李卫琳;;漫谈网络数据库[J];科技信息;2009年18期
4 刘颖;;网上标准文献的检索[J];高校图书情报论坛;2003年02期
5 牛耘;网络环境下的计算机信息检索[J];图书馆;1997年03期
6 刘小敏;史银龙;;基于P2P网络的信息检索[J];北京工业职业技术学院学报;2009年04期
7 罗映红;基于网络的信息检索与信息检索能力的培养[J];高校图书馆工作;2004年02期
8 李彦;;基于Google搜索引擎的原理及使用[J];现代电子技术;2010年02期
9 吴婷婷;;国内外会议信息资源概览[J];贵图学刊;2011年01期
10 赵悦;陈凌晖;;基于P2P技术的信息检索[J];情报理论与实践;2007年06期
中国重要会议论文全文数据库 前10条
1 徐祥来;郭士忠;张丽华;;钢铁行业信息检索基础知识与研究[A];2008年河北省轧钢技术与学术年会论文集(上)[C];2008年
2 曾莉红;;基于网络的信息包装与数据加密[A];第十一届全国包装工程学术会议论文集(一)[C];2007年
3 孙金立;李路路;王栋;;生物信息检索教学网的建设[A];向数字化转型的图书馆工作[C];2004年
4 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
5 刘洋;;一种基于Web Intelligence的智能信息代理系统初探[A];第一届学生计算语言学研讨会论文集[C];2002年
6 孙金立;李路路;董明强;;建立生物信息检索教学网的研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
7 ;编者的话[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
8 米晓红;;一种基于LSI的用户兴趣模型构建方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
9 王敬成;;HNC农村智能信息检索系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
10 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国重要报纸全文数据库 前10条
1 希安;微软试水信息检索[N];经济日报;2004年
2 叶静;开辟信息检索的新天地[N];人民邮电;2001年
3 本报记者 潘永花;组件化平台提升信息检索效率[N];网络世界;2003年
4 刘静一;个人档案信息检索[N];建筑报;2000年
5 刘光强;搜索个人、企业、垂直三大搜索新进展[N];中国计算机报;2007年
6 柏荣;国家973项目在因特网大规模信息检索领域取得突破[N];中国高新技术产业导报;2003年
7 刘立新;信息社会技术前瞻[N];学习时报;2006年
8 常燕杰;商用搜索 须打智慧牌[N];中国计算机报;2006年
9 微软中国研究院 陈正 李明镜 马维英;互联网上图像信息检索[N];计算机世界;2001年
10 夏飞平 蒋光君;深圳局:信息检索实现“一点通”[N];中国国门时报;2009年
中国博士学位论文全文数据库 前10条
1 吴定峰;基于本体的语义搜索模型研究[D];中国农业科学院;2012年
2 郑红;分布式系统形式化建模技术研究[D];中国科学院研究生院(软件研究所);2003年
3 董道国;高维数据索引结构研究[D];复旦大学;2005年
4 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
5 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
6 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年
7 林古立;互联网信息检索中的多样化排序研究及应用[D];华南理工大学;2011年
8 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
9 马马杜 桑卡雷;基于多智能体的流体动力行业虚拟联盟信息检索的研究[D];浙江大学;2002年
10 陈晓江;分布式系统软件体系结构建模与开发方法研究[D];西北大学;2010年
中国硕士学位论文全文数据库 前10条
1 刘红星;分布式系统中的文本信息检索技术研究[D];清华大学;2004年
2 夏汉川;基于网络的智能家居系统的研究与应用[D];广东工业大学;2005年
3 侯丽敏;基于网络的智能答疑系统的研究与实现[D];河南大学;2005年
4 乔智勇;Web数据挖掘系统的设计及关键技术研究[D];西安电子科技大学;2002年
5 杨才峰;基于自动分类的元搜索引擎的研究与应用[D];华北电力大学(河北);2005年
6 郭磊;P2P系统中的信息检索理论及应用研究[D];山东师范大学;2011年
7 宋海林;基于语言模型的信息检索中负反馈技术的研究与实现[D];内蒙古大学;2011年
8 管玉娟;基于智能Agent的个性化信息检索技术研究[D];西安建筑科技大学;2005年
9 杭月芹;基于文档查询信息的检索系统研究与实现[D];扬州大学;2005年
10 刘壁松;策略可扩展的搜索引擎研究和实现[D];清华大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026