收藏本站
《北京工业大学》 2001年
收藏 | 手机打开
二维码
手机客户端打开本文

中文智能搜索引擎关键技术研究

贾自艳  
【摘要】: 本文主要研究中文智能搜索引擎的概念检索新思路以及“以网对网”新理论,在这种理论 指导下,研究开发出:基于知识库的概念检索并开发出相应的知识库管理系统;概念联想工具 系统用于支持基于n元语法的概念检索;基于语料库的新词发现系统用于支持前面两种概念检 索系统;最后设计和实现了智能数据库检索的实验系统。 第一章 概述。首先说明了论文的意义和目的;接着介绍了自然语言处理技术,概述了本 文的研究方法和策略;最后介绍各章研究内容并给出论文框架。 第二章 概念检索。主要研究中文智能搜索引擎的概念检索新思路。首先介绍了“以网对 网”理论,接着讲述了概念检索的基本原理和特征,最后给出了概念检索的实现系统——基于 知识库的概念检索、基于n元语法的概念检索、基于语料库的知识发现和智能数据库检索实验 系统。 第三章 基于知识库的概念检索。研究概念语义网络的构建以及基于知识库概念检索的实 现原理,介绍它的具体实现过程,最后对该系统进行了分析和总结。 第四章 知识库管理系统,它是基于知识库概念检索的辅助工具。在本章中研究了知识库 的结构,介绍了本系统的功能,并且对该系统的实现进行了详细介绍。 第五章 基于语料库的知识发现。它的研究是自然语言研究两种方法——基于统计和基于 规则的统一。它不仅是对两种概念检索系统的支持,也对自动文摘的研究有很大的帮助。 第六章 概念联想工具系统。首先介绍了N元语法,并且回顾了基于语料库的知识发现。 接着对该系统所用到的两种知识库(表面层次的广度联想知识库、语义层次的深度联想知识库) 的结构进行了介绍。最后,具体地讲述了该系统的实现。 第七章 研究智能数据库检索。在本章中首先研究了数据库检索系统的原理设计。接着主 要研究该系统用到的知识库(广义联想知识库、狭义联想知识库、版本号联想知识库)的构建。最 后,讲到了概念联想的具体实现。 第八章 结束语。是对全文的总结和对未来研究工作的展望。
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2001
【分类号】:TP393.09;TP391.3

【引证文献】
中国期刊全文数据库 前1条
1 杨俊芳;智能AGENT技术在信息检索中的应用[J];山西电子技术;2004年04期
中国博士学位论文全文数据库 前1条
1 贾自艳;Web信息智能获取若干关键问题研究[D];中国科学院研究生院(计算技术研究所);2004年
中国硕士学位论文全文数据库 前1条
1 王明燕;基于WEB页面的关键词与关键概念提取技术[D];北京工业大学;2003年
【参考文献】
中国期刊全文数据库 前10条
1 杨晓兰,钟义信;基于文本理解的自动文摘系统研究与实现[J];电子学报;1998年07期
2 陈桂林,王永成;Internet网络信息自动摘要的研究[J];高技术通讯;1999年02期
3 王建波,杜春玲,王开铸;基于篇章理解的自动文摘研究[J];中文信息学报;1995年03期
4 朱丽;动态构词标引研究[J];情报学报;1998年03期
5 王永成,顾晓明,王丽霞;中文文献主题的自动标引[J];情报学报;1998年03期
6 甘霖,王勇,方平;关于Web网上智能检索系统的研究——GeneCards介绍[J];情报学报;1999年02期
7 成颖,史九林;自动分类研究现状与展望[J];情报学报;1999年01期
8 曹素青,曾伏虎,曹焕光;一个中文文本自动分类数学模型[J];情报学报;1999年01期
9 吴起立,李朝晖;题名自动分类标引探讨[J];情报学报;1999年01期
10 杨晓兰,钟义信;基于全信息词典的自动文摘系统研究与实现[J];情报学报;1997年06期
【共引文献】
中国期刊全文数据库 前10条
1 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
2 刘斌,黄铁军,程军,高文;一种新的基于统计的自动文本分类方法[J];中文信息学报;2002年06期
3 褚金正,章兢;基于几何距离可分性判据的文本特征提取[J];企业技术开发;2005年07期
4 张仰森,徐波,曹元大;自然语言处理中的语言模型及其比较研究[J];广西师范大学学报(自然科学版);2003年01期
5 江志雄,丁岳伟;基于K-近邻方法的网络信息文本分类[J];上海理工大学学报;2005年01期
6 丁文斌,李斌,罗浩;基于改进贝叶斯的垃圾邮件过滤系统设计与实现[J];计算机工程与应用;2005年18期
7 林鸿飞,姚天顺;基于示例的中文文本过滤模型[J];大连理工大学学报;2000年03期
8 程玉胜,任广永;基于ROUGH集的决策树测试属性选择方法[J];安庆师范学院学报(自然科学版);2004年04期
9 程玉胜;Rosetta实验系统在机器学习中的应用[J];安庆师范学院学报(自然科学版);2005年02期
10 金纯;浅谈计算机自然语言理解[J];浙江中医学院学报;2005年03期
中国重要会议论文全文数据库 前10条
1 黎琳;;Web内容挖掘在数字图书馆中的应用[A];中国工程物理研究院第七届电子技术青年学术交流会论文集[C];2005年
2 朱学锋;俞士汶;李峰;;汉语语素库的构造及其同语法信息词典的集成[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
3 陶晓燕;;网络信息资源的分类组织[A];山西省科学技术情报学会学术年会论文集[C];2004年
4 范文田;;科技期刊编辑必须掌握信息检索方法[A];第五届全国核心期刊与期刊国际化、网络化研讨会论文集[C];2007年
5 高秀恒;钱红兵;;一种基于Agent增强的软件审查过程模型[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
6 任玉辉;张涛;柏庆岩;钱学明;张东平;王云川;;轧钢加热炉加热过程最优控制与智能系统的开发与应用[A];2005中国钢铁年会论文集(第4卷)[C];2005年
7 陶钧;朱学其;林文喜;;高炉配料自动控制方法研究[A];2008年全国炼铁生产技术会议暨炼铁年会文集(下册)[C];2008年
8 单永明;;汉语文本的篇章结构及其标引算法的研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 万敏;罗振声;郭玉箐;;自动文摘系统中的意义段划分问题研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
10 张凯;吴丽辉;李盛韬;程学旗;;基于查询语义的数据库中文界面研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 陈军;软判决译码的研究[D];西安电子科技大学;1999年
2 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
3 张智雄;Internet科技信息资源门户网站(STIP)系统的实践研究[D];中国科学院文献情报中心;2000年
4 肖明;WWW科技信息资源自动标引的理论与实践研究[D];中国科学院文献情报中心;2001年
5 郭大蕾;车辆悬架振动的神经网络半主动控制[D];南京航空航天大学;2002年
6 彭水生;轮机模拟器6S60MC柴油主机仿真系统与故障模拟[D];大连海事大学;2000年
7 陆能枝;核应急决策支持系统的框架结构及模糊决策方法在评估子系统的应用[D];中国原子能科学研究院;2001年
8 王拥军;需求工程中的不确定性研究[D];西北工业大学;2002年
9 蒲莹;汽轮发电机故障在线综合诊断系统的研究[D];华北电力(北京)大学;2001年
10 WANG Jiayue;[D];广东外语外贸大学;2003年
中国硕士学位论文全文数据库 前10条
1 张鸣;学科专题知识库的知识组织及实现研究[D];武汉大学;2005年
2 何尧;基于半监督学习的中文文档分类技术研究[D];中南大学;2005年
3 刘延亮;一种文本聚类原型系统的设计与实现[D];大连理工大学;2006年
4 甘立国;中文文本分类系统的研究与实现[D];北京化工大学;2006年
5 毛伟;基于统计语言模型的中文自动文本分类系统[D];北京邮电大学;2006年
6 叶浩;基于类信息的潜在语义多类文本分类模型研究[D];江西师范大学;2006年
7 刘斌;数字图书馆中基于统计的自动文本分类方法研究[D];中国科学院研究生院(计算技术研究所);2002年
8 杨振;基于Rough Set理论的文本分类器研究[D];辽宁科技大学;2006年
9 王晓霞;基于支持向量机的中文网页自动分类技术研究[D];中北大学;2007年
10 余俊英;文本分类中特征选择方法的研究[D];江西师范大学;2007年
【同被引文献】
中国期刊全文数据库 前10条
1 张义忠,赵明生,朱精南;基于内容的网页特征提取[J];计算机工程与应用;2001年10期
2 马亮,陈群秀,王俊,徐国伟;智能Web中文主题信息收集系统IRobot的设计[J];中文信息学报;2002年05期
3 罗丽姗;;垂直搜索引擎发展概述[J];图书馆学研究;2006年12期
4 林鸿飞,高仁璟;基于潜在语义索引的文本摘要方法[J];大连理工大学学报;2001年06期
5 王宏钧,张惠苓,李翠荣;标引关键词[J];大连民族学院学报;2000年01期
6 牛伟霞,张永奎;潜在语义索引方法在信息过滤中的应用[J];计算机工程与应用;2001年09期
7 邢玲,史杏荣;基于UCL的网页自动标引技术[J];计算机工程与应用;2004年17期
8 刘迁;贾惠波;;中文信息处理中自动分词技术的研究与展望[J];计算机工程与应用;2006年03期
9 罗三定,黄勇;一个应用模糊方法的智能搜索引擎的构建[J];计算机工程;2000年12期
10 陶跃华,孙茂松,王锡钢;因特网搜索引擎评价系统[J];计算机工程与科学;2001年03期
中国重要会议论文全文数据库 前1条
1 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
中国博士学位论文全文数据库 前5条
1 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
2 肖明;WWW科技信息资源自动标引的理论与实践研究[D];中国科学院文献情报中心;2001年
3 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
4 彭涛;面向专业搜索引擎的主题爬行技术研究[D];吉林大学;2007年
5 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 寿周翔;专业搜索引擎的研究与设计[D];浙江大学;2005年
2 刘玮玮;搜索引擎中主题爬虫的研究与实现[D];南京理工大学;2006年
3 王晓伟;垂直搜索引擎若干关键技术的研究[D];浙江大学;2007年
4 邱正国;主题蜘蛛的研究及实现[D];南京师范大学;2007年
5 姚琪;垂直搜索引擎系统的研究与设计[D];上海交通大学;2008年
6 李朝阳;经济文献数据库计算机标引研究[D];南京农业大学;2000年
7 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
8 郭琰;元搜索引擎的关键技术研究及系统实现[D];南京理工大学;2002年
9 赵志荣;个性化搜索引擎的研究、设计与实现[D];四川大学;2002年
10 侯震宇;主题型搜索引擎的研究与实现[D];中国科学院研究生院(文献情报中心);2003年
【二级引证文献】
中国期刊全文数据库 前2条
1 武胜良;;数据挖掘中模糊聚类方法在信息检索中的应用[J];当代经理人(中旬刊);2006年15期
2 刘华;;关键词自动标引系统实现[J];现代图书情报技术;2006年02期
中国重要会议论文全文数据库 前2条
1 张旭成;宋传宝;;基于文本类别信息熵的中文文档关键词提取[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
2 陈沛;;搜索的未来[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前1条
1 何琳;古农学本体的半自动构建及检索研究[D];南京农业大学;2007年
中国硕士学位论文全文数据库 前6条
1 张园园;基于用户兴趣的个性化搜索引擎的分析与研究[D];燕山大学;2006年
2 耿志杰;数字档案馆个性化服务研究[D];广西民族大学;2007年
3 杨明莉;基于语义网的智能搜索模型的研究[D];东北师范大学;2007年
4 毛平;基于领域本体的文本信息语义检索研究[D];南京理工大学;2007年
5 金晓鸥;互联网舆情信息获取与分析研究[D];上海交通大学;2008年
6 牟力科;Web中文信息抽取技术与命名实体识别方法的研究[D];西北大学;2008年
【二级参考文献】
中国期刊全文数据库 前10条
1 王永成,许慧敏;OA-1.4 版中文自动摘要系统[J];高技术通讯;1998年01期
2 江红,吴立德,沙新时;机器翻译系统中概念词典的设计与实现[J];计算机研究与发展;1995年03期
3 吴胜远;一种汉语分词方法[J];计算机研究与发展;1996年04期
4 王厚峰,戴大为;汉语句法结构标注的研究[J];计算机研究与发展;1997年03期
5 骆正清,陈增武,胡上序;一种改进的MM分词方法的算法设计[J];中文信息学报;1996年03期
6 王懋江,吴振益;科技汉、日词汇的计算机计量及中日英文字的比较[J];中文信息学报;1995年02期
7 王建波,杜春玲,王开铸;基于篇章理解的自动文摘研究[J];中文信息学报;1995年03期
8 叶新明;徐进鸿;;中文文献自动分类研究[J];情报科学;1992年05期
9 靳从,樊春丽,杨静宇;主题词自动标引中的知识处理方法[J];情报理论与实践;1996年02期
10 李明,沈红君;情报检索智能化[J];情报理论与实践;1996年06期
【相似文献】
中国期刊全文数据库 前10条
1 赵源;;基于最大匹配的中文分词改进算法研究[J];科技信息;2010年35期
2 胡兆芹,张士靖;概念检索在检索网络信息中的应用[J];中华医学图书情报杂志;2005年02期
3 郑庆华,王朝静,孙霞;一种基于结构化语料库的概念语义网络自动生成算法[J];计算机研究与发展;2005年03期
4 宋雯斐;王洋;;自然语言检索中的概念语义控制[J];计算机时代;2011年02期
5 李蕾,王楠,张剑,钟义信,郭祥昊,贾自燕;中文搜索引擎概念检索初探[J];计算机工程与应用;2000年06期
6 唐培丽;解飞;陈志雨;;基于概念检索的中文搜索引擎研究[J];长春大学学报;2006年04期
7 李蕾,王楠,钟义信,郭祥昊,韩鹏,贾自燕,高清霞;基于语义网络的概念检索研究与实现[J];情报学报;2000年05期
8 李平,田桂斌,何巍;概念检索实现的研究[J];长春光学精密机械学院学报;2001年02期
9 徐海燕;网上中文概念检索系统[J];情报杂志;2003年01期
10 李诚德;文献标引与概念检索法[J];世界标准化与质量管理;1995年11期
中国重要会议论文全文数据库 前7条
1 刘智颖;;时间短语的分析与识别[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 李信利;;基于关键词聚类的论文相似性检索[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
3 汪明;熊璋;吴晶;;基于LDAP的多语言概念检索模型的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
4 任慧玲;胡铁军;李丹亚;钱庆;李军莲;诸文雁;杨滨;;结合CBM的十年发展历程谈医学网络数据库及其检索系统的发展趋势[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
5 李慧;张民;宋源清;;网络搜索引擎[A];2009全国计算机网络与通信学术会议论文集[C];2009年
6 章成志;章成敏;王萍;;基于语义的同义词识别算法研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 王洪俊 ;沈水荣 ;黄翬 ;;“人民金典”语义检索系统实现方法和技术[A];中国新闻技术工作者联合会2011年学术年会论文集(上篇)[C];2011年
中国重要报纸全文数据库 前5条
1 赵志荣;专题性搜索引擎[N];计算机世界;2000年
2 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
3 钱平;我国农业网站的差距[N];农民日报;2001年
4 张颖;拯救被信息“淹没”的企业[N];计算机世界;2003年
5 戴丽昕;轻轻点击:掌握世界知识产权信息[N];上海科技报;2009年
中国博士学位论文全文数据库 前8条
1 王兰成;基于XMARC信息描述的知识标引与概念检索研究[D];东华大学;2004年
2 王鑫印;无结构和半结构信息检索相关技术研究[D];复旦大学;2007年
3 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
4 贺文锐;面向网络协同制造的资源优化配置技术研究[D];西北工业大学;2007年
5 刘竟;面向概念检索的农史信息门户的设计与构建[D];南京农业大学;2008年
6 张磊;个性化信息分发及概念检索的研究[D];中国科学院研究生院(计算技术研究所);2002年
7 刘慧;信息检索中用户需求的概念分析研究[D];上海交通大学;2009年
8 蒋玲;面向学科的知识元标引关键技术研究[D];华中师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 贾自艳;中文智能搜索引擎关键技术研究[D];北京工业大学;2001年
2 李欣;基于概念检索的智能信息检索技术研究[D];华中师范大学;2004年
3 董锦霞;基于菱形思维的概念检索模型研究[D];大连理工大学;2011年
4 谭义红;关联规则挖掘及其在概念检索中的应用研究[D];湖南大学;2003年
5 陈先;智能搜索引擎关键技术研究与实现[D];哈尔滨工程大学;2003年
6 徐芳;利用概念检索实现专业搜索引擎的智能化[D];北京化工大学;2008年
7 唐培丽;基于语义的汉语文本主题词提取算法研究与实现[D];吉林大学;2005年
8 谭德坤;文本挖掘及其在UDDI Registry智能检索中的应用[D];昆明理工大学;2004年
9 钟伶;基于本体的益气健脾方的知识表示与应用初探[D];福建中医学院;2005年
10 韦佳;语义Web在概念检索中的研究与应用[D];哈尔滨工业大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026