收藏本站
《北京化工大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

化工专业搜索引擎系统架构设计与实现

吕俊  
【摘要】:目前,Google等综合型搜索引擎系统已经取得了极大的成功,但是,当使用综合型搜索引擎来检索专业内容时,往往找不到专家们需要的内容。因此,有必要开发专业搜索引擎系统宋满足领域专家的要求。 该文研究并实现了化工专业搜索引擎系统。为了实现该专业搜索引擎系统,该文引入了综合型搜索引擎系统的架构模型,即网络蜘蛛、索引器和检索器,并且在该模型中增加了文件处理模块,专门用于转换网页文件为纯文本文件。该搜索引擎系统基于全文索引引擎Apache Lucene构建。在设计和开发的过程中,严格按照软件工程代码重用的要求重用了Lucene的大量源码,并在此基础上做了改进和扩充。该文介绍了文件处理器、检索器、公用模块等模块的设计和实现方法以及系统集成方案,重点讨论了文件处理器的程序逻辑以及检索器中摘要生成器和输出渲染器的算法。最后,该文介绍了系统的部署和运行方式,并且展示了文件处理器和检索器的程序运行结果。 该化工专业搜索引擎系统经过了单元测试和集成测试,已经可以稳定的运行。不久,该搜索引擎系统就会正式推出,相信能够给化工领域专家提供大量帮助。
【学位授予单位】:北京化工大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP391.3

【引证文献】
中国硕士学位论文全文数据库 前2条
1 徐耀;基于Agent的智能化搜索引擎系统[D];北京化工大学;2006年
2 胡元军;基于Agent的分布式专业信息采集系统[D];北京化工大学;2007年
【参考文献】
中国期刊全文数据库 前10条
1 欧振猛,余顺争;中文分词算法在搜索引擎应用中的研究[J];计算机工程与应用;2000年08期
2 钟涛,陈新明,万钧,张世永;中文文本WEB搜索引擎的设计与实现[J];计算机工程与应用;2001年17期
3 陈燕娜,邵志清;基于全文搜索的中文搜索引擎设计技术[J];计算机工程与应用;2002年17期
4 王剑;邵志清;;大规模中文搜索引擎的架构和设计技术[J];计算机科学;2002年01期
5 丁承,邵志清;基于字表的中文搜索引擎分词系统的设计与实现[J];计算机工程;2001年02期
6 姚砺,束永安;用JavaCC构造编译器的方法[J];计算机工程;2003年09期
7 杜可亮,李星,杨文峰;用PAT Tree构建Internet搜索引擎分布式数据库[J];计算机应用;2002年09期
8 贺广宜,罗莉;分布式搜索引擎的设计与实现[J];计算机应用;2003年05期
9 陈华辉;一个中英文全文搜索引擎的设计与实现[J];计算机应用研究;2001年03期
10 沈红芳;互联网搜索引擎及其功能优化模型[J];情报科学;2000年01期
【共引文献】
中国期刊全文数据库 前10条
1 王锡钢,刘振文;搜索引擎技术的分析与研究[J];鞍山钢铁学院学报;2002年06期
2 王俊生;施运梅;张仰森;;基于Hadoop的分布式搜索引擎关键技术[J];北京信息科技大学学报(自然科学版);2011年04期
3 文庭孝;汉语自动分词研究进展[J];图书与情报;2005年05期
4 丛荣华;;网络教育中的数据收集技术[J];长春师范学院学报;2006年10期
5 刘志勇;网络环境下信息检索效率的评价[J];大连大学学报;2002年01期
6 强彦;谢红薇;;基于Web数据的本体概念抽取[J];电脑开发与应用;2007年11期
7 闫淑红;;基于搜索引擎的信息查询技术研究[J];电脑开发与应用;2011年07期
8 周健;孙丽艳;;用JavaCC和JJTree构造扩展DTD解析器[J];电脑知识与技术(学术交流);2007年17期
9 马瑞民,李建平,王浩畅;基于元搜索的专题式Web搜索引擎的实现[J];大庆石油学院学报;2002年04期
10 刘寿强;孟敬;;基于JavaLucene的分级鉴权资源管理系统的研究与实现[J];计算机安全;2012年04期
中国重要会议论文全文数据库 前3条
1 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
2 刘寿强;;基于Lucene的分级鉴权企业搜索引擎研究与设计[A];第二十一次全国计算机安全学术交流会论文集[C];2006年
3 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
中国博士学位论文全文数据库 前6条
1 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
2 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
3 杨震;个性化信息获取方法的研究[D];大连理工大学;2004年
4 寇继虹;水利网络信息资源组织模式研究[D];武汉大学;2005年
5 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
6 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年
中国硕士学位论文全文数据库 前10条
1 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
2 巫昌凯;企业知识库系统中复杂查询系统的设计与实现[D];华南理工大学;2010年
3 刘照然;远程教育中智能答疑系统的研究与实现[D];西安电子科技大学;2010年
4 席敏;基于单汉字索引的全文检索系统的研究与实现[D];西安电子科技大学;2010年
5 吴代文;基于Lucene的二次全文检索系统设计与实现[D];西安电子科技大学;2009年
6 戚学磊;基于Lucene的站内搜索引擎技术的研究与应用[D];太原理工大学;2011年
7 张艳丽;面向对象的XML在网络安全事件数据处理中的应用[D];北方工业大学;2011年
8 王芳芳;基于Agent的网络信息检索[D];沈阳工业大学;2011年
9 刘海涛;基于自然语言理解的中文搜索引擎[D];河北科技大学;2011年
10 袁黎明;双边网络视角下搜索引擎平台的隔离机制演进[D];北京交通大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 罗春;;地理信息系统发展的新趋势:面向服务的体系结构[J];地理信息世界;2006年05期
2 毛新军,王怀民,陈火旺;多Agent系统计算的意愿理论[J];国防科技大学学报;1998年03期
3 谢丹夏;Web上的数据挖掘技术和工具设计[J];计算机工程与应用;2001年06期
4 陈燕娜,邵志清;基于全文搜索的中文搜索引擎设计技术[J];计算机工程与应用;2002年17期
5 田萱,刘希玉,孟强;实现Web页面的智能个性化检索[J];计算机工程与应用;2003年01期
6 涂承胜,鲁明羽,陆玉昌;Web挖掘研究综述[J];计算机工程与应用;2003年10期
7 李盛韬;余智华;程学旗;白硕;;Web信息采集研究进展[J];计算机科学;2003年02期
8 蒋澄,马范援,蒋思杰;中英文WWW搜索引擎的信息处理[J];计算机工程;1999年04期
9 陈华辉;一个中英文全文搜索引擎的设计与实现[J];计算机应用研究;2001年03期
10 冯书晓,徐新,杨春梅;国内中文分词技术研究新进展[J];情报杂志;2002年11期
中国硕士学位论文全文数据库 前4条
1 刘琨;搜索引擎的研究与实现[D];西安电子科技大学;2004年
2 吴东华;Web信息获取技术研究[D];南京理工大学;2004年
3 李益;基于多Agent的智能搜索引擎系统研究[D];哈尔滨工程大学;2004年
4 江毅铭;专业搜索引擎索引技术的研究与实现[D];北京化工大学;2005年
【二级引证文献】
中国硕士学位论文全文数据库 前3条
1 郭世胜;基于Agent的搜索引擎的研究与实现[D];大连海事大学;2010年
2 王炎炎;基于Web的分布式网络管理关键技术研究[D];西安电子科技大学;2010年
3 冯华威;基于Witness的集装箱码头物流系统Agent建模方法研究[D];武汉理工大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 林彤,江志军;Internet的搜索引擎[J];计算机工程与应用;2000年05期
2 杨文峰,李星;基于PAT TREE统计语言模型与关键词自动提取[J];计算机工程与应用;2001年15期
3 钟涛,陈新明,万钧,张世永;中文文本WEB搜索引擎的设计与实现[J];计算机工程与应用;2001年17期
4 顾春庆,于玉,顾永立,胡运发;汉字全文检索的实现与探讨[J];计算机工程;1998年02期
5 蒋澄,马范援,蒋思杰;中英文WWW搜索引擎的信息处理[J];计算机工程;1999年04期
6 严威,赵政;开发中文搜索引擎汉语处理的关键技术[J];计算机工程;1999年06期
7 丁承,邵志清;基于字表的中文搜索引擎分词系统的设计与实现[J];计算机工程;2001年02期
8 姚砺,束永安;用JavaCC构造编译器的方法[J];计算机工程;2003年09期
9 陈滢,徐宏炳,王能斌;WebCORD:协作式Web资源发现系统模型[J];计算机学报;1998年04期
10 周涛;中文搜索引擎[J];图书馆理论与实践;2000年03期
【相似文献】
中国期刊全文数据库 前10条
1 孙建辉;圈圈点点Internet上的WWW检索器[J];网络与信息;1998年02期
2 谭营军;李翠霞;;搜索引擎技术的研究与展望[J];电脑知识与技术;2011年03期
3 丁兆贵;金敏;;基于Lucene的个性化搜索引擎研究与实现[J];计算机技术与发展;2011年02期
4 张汛涞;搜索引擎的设计剖析[J];计算机工程与科学;2002年04期
5 何东炯;用户差异性对信息服务模式的影响及对策[J];中国传媒科技;2004年05期
6 吴青;夏红霞;赵广辉;刘春燕;;基于Lucene全文检索引擎的应用与改进[J];武汉理工大学学报;2008年07期
7 吴锦前;“私人助理”应用一二三(3)[J];中国传媒科技;2002年04期
8 王铖伟;;电子商务智能搜索及挖掘系统检索器的设计[J];有色金属设计;2007年04期
9 李航;叶飞跃;边利亚;于志安;;校园网垂直搜索引擎方法研究与实现[J];微计算机信息;2010年30期
10 杜亚军,邱小平,徐扬;中文搜索引擎的智能探讨[J];计算机应用研究;2004年04期
中国重要报纸全文数据库 前8条
1 彭芳;搜索也专业[N];中国计算机报;2004年
2 赵志荣;专题性搜索引擎[N];计算机世界;2000年
3 本报记者 王翌;8848:优化EC流程[N];计算机世界;2004年
4 本报记者 任延华;运气=260万美元?[N];国际商报;2000年
5 于发修;寻找搜索的技巧[N];中国计算机报;2001年
6 应晓敏 窦文华;条条道路通罗马[N];计算机世界;2003年
7 但华香;“发”大财[N];网络世界;2000年
8 冯国强;更新虚拟设备驱动优化系统性能[N];中国电脑教育报;2002年
中国硕士学位论文全文数据库 前9条
1 吕俊;化工专业搜索引擎系统架构设计与实现[D];北京化工大学;2005年
2 翟凤红;商品搜索引擎系统[D];吉林大学;2005年
3 胡晓博;面向特定领域的专业搜索引擎的架构与实现方法[D];哈尔滨工程大学;2007年
4 房志峰;专业搜索引擎中文件服务系统设计与实现[D];北京化工大学;2005年
5 王亮;搜索引擎及其相关性排序研究[D];武汉大学;2004年
6 赵善明;基于Lucene的主题搜索引擎研究[D];西安电子科技大学;2008年
7 王汉萍;粗糙集理论在文本挖掘的分类算法中的应用研究[D];中国海洋大学;2003年
8 张校乾;基于Lucene的全文检索系统的研究与应用[D];大连理工大学;2005年
9 王彤宇;应用于学生知识拓展的智能WEB检索系统[D];山东大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026