收藏本站
《南京农业大学》 2001年
收藏 | 手机打开
二维码
手机客户端打开本文

基于知识库的中文网络检索工具——经济信息智能搜索引擎研究

薛鹏军  
【摘要】: 本论文试图从计算机技术和图书情报学理论与实践手段出发,应用文献信息自动标 引和组织技术于网页的加工处理过程上。在分析了中外搜索引擎的现状与不足,搜索引 擎分类主题一体化进展以及网页主要特征的基础上,本文提出了针对中文网页特征的信 息标引和组织方案,并利用相关网络技术,构建了一个实验性经济信息智能搜索引擎。 中文网页的自动标引思想主要基于知识库的概念进行。知识库实际上是一个基于《中 图法》的专家知识系统,包括了中图法库、汉表库、分类号—主题词对应库、同义词库、 关键词库、停用词库和特例词库等若干数据库。在确定网页基本信息标引源的基础上, 中文网页主题标引运用了基于词频的统计加权法;通过与分类号—主题词对应库主题词 串的词面相似度计算,进一步完成中文网页的赋号标引,即分类标引。 随后,本文利用Borland Delphi、Visual FoxPro等工具设计并开发了一个包括中文网 页文本信息提取、自动抽词、自动主题与分类标引、标引结果处理、知识库维护等功能, 用以处理中文网页信息的自动标引实验系统;并简要介绍了系统的设计、工作流程、使 用方法及运行条件。 根据分类主题一体化发展方向,本文还设计了检索型、目录型及分类主题一体化检 索系统,并提出基于集成词表的不同引擎间类目体系的兼容互换方案。 文章的最后对中文网页自动标引系统从系统标引效率、标引准确率等方面进行了综 合测评,并客观分析了系统存在的问题和不足。与手工标引相比,自动标引正确率达到 了80%以上。
【学位授予单位】:南京农业大学
【学位级别】:硕士
【学位授予年份】:2001
【分类号】:G354

手机知网App
【引证文献】
中国期刊全文数据库 前6条
1 侯汉清,薛鹏军;基于知识库的网页自动标引和自动分类系统的设计[J];大学图书馆学报;2004年01期
2 丁璇,侯汉清,章成志;中文网页标引源主题表达能力的调查统计[J];大学图书馆学报;2002年06期
3 赵妍,侯汉清,耿金玉,叶常妍,何群;中文期刊论文自动标引加权设计研究[J];新世纪图书馆;2004年01期
4 仲云云,侯汉清,薛鹏军;网页自动标引方案的优选及标引性能的测评[J];情报科学;2002年10期
5 崔艳华;中图法与网上中文分类系统基本大类结构及序列的比较[J];沈阳教育学院学报;2005年01期
6 包冬梅,周曰卿;著名中英文搜索引擎检索性能测评[J];现代图书情报技术;2004年01期
中国硕士学位论文全文数据库 前3条
1 杜慧平;自然语言叙词表自动构建研究[D];南京农业大学;2007年
2 孙莹;社会保障数据整合及公众服务系统的研究与实现[D];解放军信息工程大学;2006年
3 周开朋;湿地保护的本体设计及其文档集的分级排序[D];大连理工大学;2006年
【参考文献】
中国期刊全文数据库 前10条
1 任瑞娟,李洪建;中文WWW搜索引擎比较研究[J];大学图书馆学报;1999年05期
2 马张华,张宇萌;指南型网络分类体系初探[J];大学图书馆学报;2000年03期
3 陈桂林,王永成;Internet网络信息自动摘要的研究[J];高技术通讯;1999年02期
4 孙及园,林锦贤;对Web网页的查询及信息提取[J];福州大学学报(自然科学版);2000年03期
5 王小华,张国煊;基于多元统计分析的电子文本自动分类[J];杭州电子工业学院学报;1999年03期
6 衡中青;INTERNET上的索引探微[J];情报科学;2000年01期
7 沈红芳;互联网搜索引擎及其功能优化模型[J];情报科学;2000年01期
8 王建平;网络(联机)环境中情报检索语言的几个问题[J];情报科学;2000年04期
9 曹东,韩全惜,庄军;运用情报检索语言理论与方法完善搜索引擎的功能[J];情报理论与实践;2000年01期
10 宋明亮;汉语词汇字面相似性原理与后控制词表动态维护研究[J];情报学报;1996年04期
【共引文献】
中国期刊全文数据库 前10条
1 吴昌合;质疑分类法的同类书排列方法[J];安徽大学学报(哲学社会科学版);2002年03期
2 王海梅,朱世顺,周献中;广域网上基于图像数据挖掘系统设计的探讨[J];兵工学报;2003年04期
3 陈立华;从阮冈纳赞的分面分类理论看情报检索语言的发展[J];国家图书馆学刊;2001年03期
4 林国华;图书馆在网络信息资源配置中的作用探讨[J];国家图书馆学刊;2001年03期
5 卜书庆;试论数字信息资源的组织方法——如何开发和应用传统文献分类法主题法[J];国家图书馆学刊;2001年04期
6 贺定安;关于编制《中图法·网络信息分类表》的构想[J];国家图书馆学刊;2002年03期
7 沙淑欣;情报检索语言研究综述[J];国家图书馆学刊;2004年03期
8 邹婉芬;网络信息分类体系发展趋势探讨[J];国家图书馆学刊;2004年04期
9 李群;网络环境下情报检索语言兼容性探究[J];国家图书馆学刊;2005年03期
10 卜书庆;论计算机检索环境下的文献主题规范工作[J];国家图书馆学刊;1998年02期
中国重要会议论文全文数据库 前10条
1 盛作国;胡红;;情报推理的逻辑理论工具——制约逻辑在情报科学中的应用[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
2 胥永康;岳筱玲;;浅谈网络信息挖掘应用技术[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
3 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
4 高楚舒;丁于思;;因特网中文文本信息分析[A];计算机模拟与信息技术会议论文集[C];2001年
5 黎琳;;Web内容挖掘在数字图书馆中的应用[A];中国工程物理研究院第七届电子技术青年学术交流会论文集[C];2005年
6 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
7 陶晓燕;;网络信息资源的分类组织[A];山西省科学技术情报学会学术年会论文集[C];2004年
8 陈凯;胡应杰;陈博;单云;;Mindmanager在《化学信息学》教学中的应用[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
9 曹玮祺;梁华瑞;朱雷;李涓子;王克宏;;基于半结构化信息模型的信息检索[A];第六届全国计算机应用联合学术会议论文集[C];2002年
10 王小华;陆蓓;张国煊;;文本自动分类的模糊方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 张智雄;Internet科技信息资源门户网站(STIP)系统的实践研究[D];中国科学院文献情报中心;2000年
2 肖明;WWW科技信息资源自动标引的理论与实践研究[D];中国科学院文献情报中心;2001年
3 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
4 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
5 张蕾;概念结构及其应用[D];西北工业大学;2001年
6 俞方桦;互联网信息资源整合研究[D];东华大学;2001年
7 王兰成;基于XMARC信息描述的知识标引与概念检索研究[D];东华大学;2004年
8 向桂林;XML引擎研究[D];中国科学院研究生院(文献情报中心);2004年
9 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
10 关沫;复杂网络中的计算迁移问题[D];东北大学;2005年
中国硕士学位论文全文数据库 前10条
1 张鸣;学科专题知识库的知识组织及实现研究[D];武汉大学;2005年
2 蔡春勇;元搜索引擎的智能化及其设计与实验[D];福州大学;2006年
3 刘艳青;基于Web的个性化信息检索研究[D];山东大学;2005年
4 王彤宇;应用于学生知识拓展的智能WEB检索系统[D];山东大学;2005年
5 胡卓颖;专题型网页搜集器关键算法的研究及实现[D];江西师范大学;2005年
6 田宏钟;基于数据挖掘的证券业客户关系管理中的客户细分研究[D];东华大学;2005年
7 李威;基于向量空间的文本自动分类系统的研究和实现[D];兰州理工大学;2005年
8 骆昌日;基于统计方法的中文文本自动分类研究[D];华中师范大学;2004年
9 丁一;基于Web挖掘的个性化推荐服务研究[D];华中科技大学;2004年
10 司卫国;基于移动Agent的Web信息检索系统的研究[D];西安电子科技大学;2005年
【同被引文献】
中国期刊全文数据库 前10条
1 雷景生,林冬雪,符浅浅;基于改进向量空间模型的Web信息检索技术研究[J];计算机工程;2005年01期
2 印鉴,陈忆群,张钢;搜索引擎技术研究与发展[J];计算机工程;2005年14期
3 黄德才;戚华春;;PageRank算法研究[J];计算机工程;2006年04期
4 李彬,刘挺,秦兵,李生;基于语义依存的汉语句子相似度计算[J];计算机应用研究;2003年12期
5 李伟超,王兰敬;论搜索引擎的工作机制和发展趋势[J];现代情报;2002年12期
6 杨思洛;搜索引擎的排序技术研究[J];现代图书情报技术;2005年01期
7 赵妍,侯汉清,耿金玉,叶常妍,何群;中文期刊论文自动标引加权设计研究[J];新世纪图书馆;2004年01期
8 赵荣艳;杨靖华;蒋士君;;烟草病害生物防治研究进展[J];安徽农业科学;2006年22期
9 侯汉清;建立以《中国分类主题词表》为核心的检索语言兼容体系[J];国家图书馆学刊;1998年04期
10 陆鑫;利用ASP技术实现WEB数据库的访问[J];电子科技大学学报;2000年01期
中国博士学位论文全文数据库 前2条
1 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年
2 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年
中国硕士学位论文全文数据库 前10条
1 陈洁惠;搜索引擎排序算法的研究[D];河海大学;2007年
2 徐金雷;专业搜索引擎的排序算法研究[D];南京师范大学;2007年
3 查贵庭;经济新闻自动标引系统的研究[D];南京农业大学;2000年
4 李朝阳;经济文献数据库计算机标引研究[D];南京农业大学;2000年
5 高鹏;基于CORBA的异构数据库集成研究[D];广东工业大学;2001年
6 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
7 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
8 刘军;分布式智能异构数据集成支持系统的原型实现[D];大连海事大学;2003年
9 黄海;异构数据集成系统中的智能查询研究及实现[D];大连海事大学;2004年
10 罗龙艳;数字图书馆资源主题信息门户的设计与实现研究[D];四川大学;2004年
【二级引证文献】
中国期刊全文数据库 前10条
1 王凯;计算机编目条件下文献分类工作的特点及发展路向[J];大学图书情报学刊;2005年01期
2 侯汉清,薛鹏军;基于知识库的网页自动标引和自动分类系统的设计[J];大学图书馆学报;2004年01期
3 雷景生,伍庆清,王平;一种基于混合神经网络的Web文档聚类算法[J];计算机工程;2005年01期
4 雷景生,林冬雪,符浅浅;基于改进向量空间模型的Web信息检索技术研究[J];计算机工程;2005年01期
5 雷景生;基于多层向量空间模型的Web信息检索方法[J];计算机应用;2004年04期
6 赵妍,侯汉清,耿金玉,叶常妍,何群;中文期刊论文自动标引加权设计研究[J];新世纪图书馆;2004年01期
7 王凯;文献分类工作的现状与发展[J];科技情报开发与经济;2004年11期
8 侯杰;;浅谈中文图书分编人员应具有的素质和能力[J];科技情报开发与经济;2007年02期
9 章成志;数据挖掘研究现状及最新进展[J];南京工业职业技术学院学报;2003年02期
10 薛春香;夏祖奇;侯汉清;;基于语料和基于标引经验的自动分类模式比较[J];南京农业大学学报(社会科学版);2005年04期
中国重要会议论文全文数据库 前1条
1 薛春香;夏祖奇;侯汉清;;基于语料和基于标引经验的自动分类模式比较[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前1条
1 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 王彤宇;应用于学生知识拓展的智能WEB检索系统[D];山东大学;2005年
2 陆勇;面向信息检索的汉语同义词自动识别[D];南京农业大学;2005年
3 刘平冰;基于Lucene的Web站内信息搜索系统[D];电子科技大学;2005年
4 赵栓柱;基于特定领域的Wed文本信息获取系统的研究与设计[D];太原理工大学;2005年
5 熊化宇;网络信息组织的质量控制研究[D];湘潭大学;2005年
6 周开朋;湿地保护的本体设计及其文档集的分级排序[D];大连理工大学;2006年
7 林冬雪;基于改进向量空间模型的网络信息检索技术研究[D];重庆大学;2005年
8 王煜;Internet智能比较购物的研究与实现[D];浙江工商大学;2006年
9 叶昭晖;网络信息雷达系统的研究与设计[D];国防科学技术大学;2005年
10 于书翰;基于网页自动分类的搜索引擎研究[D];长春理工大学;2004年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱丽;自然语言的应用研究[J];图书与情报;1996年03期
2 殷雪松,徐斌;WWW网络搜索引擎介绍[J];大学图书馆学报;1998年04期
3 王娟琴;超维检索模式研究[J];大学图书馆学报;1999年01期
4 王永成,许慧敏;OA-1.4 版中文自动摘要系统[J];高技术通讯;1998年01期
5 陈桂林,王永成;Internet网络信息自动摘要的研究[J];高技术通讯;1999年02期
6 陈桂林,王永成,韩客松,王刚;一种高效的中文电子词表数据结构[J];计算机研究与发展;2000年01期
7 吴胜远;一种汉语分词方法[J];计算机研究与发展;1996年04期
8 王厚峰,戴大为;汉语句法结构标注的研究[J];计算机研究与发展;1997年03期
9 骆正清,陈增武,胡上序;一种改进的MM分词方法的算法设计[J];中文信息学报;1996年03期
10 王建波,杜春玲,王开铸;基于篇章理解的自动文摘研究[J];中文信息学报;1995年03期
【相似文献】
中国期刊全文数据库 前10条
1 徐险峰;;网络信息检索搜索引擎技术及发展趋势[J];江西图书馆学刊;2005年04期
2 韩进军;安园园;;搜索引擎的未来发展[J];医学信息学杂志;2007年05期
3 刘冰;胡风华;;知识库系统在智能搜索引擎中的应用[J];光盘技术;2009年02期
4 康桂英,张帆,刘春平;新一代智能搜索引擎网典研究[J];情报理论与实践;2000年03期
5 袁渊;;搜索引擎关键技术及展望[J];湖北财经高等专科学校学报;2006年05期
6 刘志娟;;虚拟参考咨询与搜索引擎的结合——智能搜索引擎诞生[J];图书情报论坛;2008年03期
7 王挺;;智能搜索引擎在企业人力资源管理决策支持系统中的应用[J];电脑知识与技术;2010年24期
8 刘志娟;黄立冬;;虚拟参考咨询与搜索引擎结合——智能搜索引擎的诞生[J];科技情报开发与经济;2008年25期
9 胡风华;刘冰;;基于知识库系统的智能搜索引擎研究[J];电脑知识与技术;2009年11期
10 刘成亮;韩海伟;;知识库系统的原理及其在智能搜索引擎中的应用[J];电脑知识与技术;2008年08期
中国重要会议论文全文数据库 前10条
1 李军;;做好经济信息工作 为经济建设服务[A];中国当代秘书群星文选[C];1999年
2 聂可嘉;;经济信息管理简论[A];高校信息理论研究[C];1997年
3 王强;黄循精;;热带作物经济信息数据库系统的设计与构建[A];中国热带作物学会第七次全国会员代表大会暨学术讨论会论文集[C];2004年
4 方晓红;;经济信息在苏南农村的传播现状调查研究[A];信息化进程中的传媒教育与传媒研究——第二届中国传播学论坛论文汇编(上册)[C];2002年
5 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 朱映华;;浅析会计信息失真的原因及对策[A];浙江省铁道学会2006年学术交流会论文集[C];2006年
7 彭崇芬;;工商企业开拓市场的信息搜集与研究[A];高校信息文献开发与利用——全国高校信息资料第6次理论研讨会论文集[C];1994年
8 张东岩;;对建设地区特色经济信息导航库的思考[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(下)[C];2003年
9 薛健;;企业如何开发高层次信息[A];中国当代秘书群星文选[C];1999年
10 张汉连;;重塑会计诚信 提高会计工作质量[A];2003年福建省会计学会理论研讨论文专辑[C];2003年
中国重要报纸全文数据库 前10条
1 王存山 作者单位:河北省经济信息中心;我省经济信息市场管理现状、问题与对策[N];河北经济日报;2004年
2 杨吉;走在“经济曲线”之前[N];财会信报;2007年
3 王光平;今年我国GDP增速降至10.8%[N];中国证券报;2008年
4 本报记者 李力实习生 晁力凡;加强禽类产品质量监管是一项长期任务[N];经济日报;2007年
5 惠晓霜;能答具体问题,智能搜索引擎叫板谷歌[N];新华每日电讯;2009年
6 本报记者 蒋峥;智能搜索引擎:能否发动新一轮上网热[N];经济日报;2000年
7 邓贺赢;经济信息扑面而来[N];辽宁日报;2000年
8 朱翠广 赵国锋;全省首家县(市)级“经济信息村村通”建成[N];石家庄日报;2006年
9 周晶;从企业信用管理看企业社会责任[N];中国贸易报;2007年
10 孙侠;中国经济信息社与日本时事社签订信息代理协议[N];新华每日电讯;2006年
中国博士学位论文全文数据库 前8条
1 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
2 刘竟;面向概念检索的农史信息门户的设计与构建[D];南京农业大学;2008年
3 舒彤;供应链协同的供应商选择与销售预测[D];湖南大学;2008年
4 常宁;我国经济信息资源短缺问题及其对策研究[D];厦门大学;2002年
5 严维石;美联储信息优势与其货币政策目标[D];复旦大学;2006年
6 马军杰;基于数据仓库与联机处理的区域经济发展管理决策支持系统研究[D];华东师范大学;2007年
7 陈铭仁;不完全金融市场中的信息创造及其效应分析[D];复旦大学;2006年
8 赵义术;电力系统最优安全控制和安全性定价[D];天津大学;2004年
中国硕士学位论文全文数据库 前10条
1 薛鹏军;基于知识库的中文网络检索工具——经济信息智能搜索引擎研究[D];南京农业大学;2001年
2 张骞;传统搜索引擎与智能搜索引擎比较研究[D];郑州大学;2012年
3 罗贤春;经济信息分析研究[D];湘潭大学;2002年
4 雷丰云;智能搜索引擎的理论分析与应用研究[D];中南大学;2007年
5 孟骁;基于语义网络的智能搜索引擎研究[D];东北师范大学;2011年
6 李振振;基于本体的智能搜索引擎研究与应用[D];青岛科技大学;2010年
7 杨延锟;面向油田信息服务的智能搜索引擎研究与应用[D];大庆石油学院;2010年
8 胡发智;论经济信息与图书营销[D];华中师范大学;2002年
9 陈东云;浅谈经济信息研究[D];华中师范大学;2002年
10 彭嘉新;经济信息在宏观经济管理中的应用研究[D];华中师范大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026