收藏本站
收藏 | 论文排版

基于Internet的智能信息检索技术研究

傅赛香  
【摘要】: 随着Internet的快速发展,特别是WWW的飞速发展,网络成为了一个全球最大的分布式的信息库,为信息共享、资源共享提供了一个良好的平台。但随着大量的信息涌入网络,信息的查找与获取也就变得越来越困难了,出现了“信息迷航”、“信息过载”等问题。作为Web上的信息检索工具—搜索引擎也面临着极大的挑战,本文主要就这一智能信息检索工具所涉及的关键技术进行了深入研究,重点从理论上研究了开发新一代的信息检索系统所面临的问题及解决方案。 本文的研究内容及所做的突破性工作如下: (1)分析了当前信息检索技术的现状,指出了当前检索技术的不足。 对网络检索工具及技术进行了全面回顾,并总结了当前检索工具所存在的主要问题及局限性,包括:检索方式不科学、索引方法不合理、结果显示单一、个性化能力差、智能程度低等。并分析了智能检索系统的一些特征,系统要能理解信息,也要能了解用户,指出了智能信息检索以概念检索为主,而不是简单的串匹配。 (2)分析了当前搜索引擎的系统结构,给出了一个新的智能搜索引擎框架结构。 本文提出了一个智能搜索引擎系统结构,围绕智能化系统,增加了领域知识库和用户知识库,增强了用户接口界面的功能。指出必须要有知识库的支持才能使搜索引擎真正达到智能化效果。 (3)提出了网络信息的搜集算法与更新策略。 Robot程序是信息搜集与信息更新的基础,本文详细地叙述了其搜集信息的排除标准、搜索策略及搜索算法设计,并给出了一个最近更新策略,保证能在数据信息变更的最短时间内进行检测、下载、更新,大大地避免死链接、无效链接,提高了搜索引擎的查询性能。 (4)突破关键词索引方法,提出“属性+内容+结构”的索引方法,并给出了属性、内容、结构的查询语言。 目前的关键词索引方法不符合语义理解的需要,网络信息的半结构化、无结构化,也使得组织、索引网络信息特别困难。本文提出要对文档的属性、结构、内容进行组织索引,以满足多接口多角度地查询需要,这对于组织、理解文档信息是有重要意义的。同时还给出了提取文档属性、结构、内容的基本方法以及相关的查询语言。 (5)分析了中文汉字的结合模式,提出一个无词典分词方法。 中文不同于英文,中文的索引需要经过分词技术。目前的基于词典的机械分词技术由于无法解决未登陆词问题及歧义问题而不能达到满意的效果,而基于语法和规则的分词法又由于语法知识、句法规则十分笼统、复杂而尚未能真正进入实际的分词系统中。本文基于Web环境提出了一个无词典分词方法,它绕过了语言语法学方面的局限,通过对词频的统计、过滤,对于提取中、高频度的词条具有良好的分词效果,也部分解决了新词问题。还引入词条的支持度、置信度概念,以及取大、取小、取中原则,用这三个过滤原则来过滤掉非真实词条,其分准率是较高的。该方法不需要训练,不需要有复杂的语言语法学知识,不需要有庞大的词典支持,分词速度快,具有重要的实用价值。 (6)研究了个性化技术,提出建立客户模型。 个性化技术作为未来商业服务的一个发展趋势,具有重要的研究意义。同时个性化技术用于信息检索也是必然的趋势,本文对个性化技术的各个方面:个性行为、模式获取、用户模型、兴趣模型、模型维护进行了分析研究,并提出了以客户模型代替用户模型的观点,给出了一个基本的客户模型示意图。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 何儒云,汤艳莉;智能化信息检索研究[J];图书馆;2003年03期
2 丁振波;;浅析智能信息检索系统中存在的问题及解决思路[J];科教文汇(中旬刊);2009年03期
3 冯永杰,孟宾,翟玉庆;Agent在智能信息检索中的应用研究[J];计算机应用研究;2002年02期
4 吴芳;丁玲;张杰;刘金亮;;跨语言信息检索中基于本体的查询扩展模型研究[J];计算机教育;2009年17期
5 宋玲,马军,莫正波,秦茂玲;基于XML的智能信息检索与聚类研究[J];山东建筑工程学院学报;2004年02期
6 陈大平;;小论网络搜索引擎与智能代理技术[J];吉林省教育学院学报(学科版);2010年02期
7 贾花萍;;Agents技术在数字图书馆智能检索中的应用[J];内江科技;2010年05期
8 马静;网上信息资源及其检索技术智能化研究[J];图书情报工作;2001年01期
9 刘艳;网络搜索引擎与智能代理技术[J];图书馆;2002年03期
10 石晶,龚震宇,裘杭萍,张毓森;基于用户兴趣模型的智能信息检索系统技术与实现[J];情报学报;2003年03期
11 原福永,李莉,李红岩;智能信息检索的设计与研究[J];燕山大学学报;2005年04期
12 张明,王煜,杨敬伟,袁方,赵红,石强;基于Ontology的智能信息检索研究[J];河北大学学报(自然科学版);2005年05期
13 刘立卿;;搜索引擎:信息检索实践[J];计算机教育;2010年10期
14 赵苏玮;刘斌;;移动Agent在信息检索中的应用与实现[J];微处理机;2009年04期
15 何昭青;面向用户的个性化Agent智能搜索系统的设计[J];邵阳学院学报;2003年02期
16 乔鸿,余锦凤;分类目录思想在信息检索中的应用——“先控”智能信息检索系统[J];现代图书情报技术;2004年11期
17 贾宏;;基于搜索引擎的数字图书馆智能信息检索[J];图书馆学研究;2006年03期
18 聂卉;;基于本体的查询扩展与规范[J];现代图书情报技术;2007年03期
19 李鹏;乔晓东;张用军;赵新力;;Ontology与CBR集成的Web智能信息检索研究[J];现代图书情报技术;2006年12期
20 王真星;但唐仁;叶长青;刘岩;吕腾;丁天怀;;本体集成的研究[J];计算机工程;2007年02期
中国重要会议论文全文数据库 前2条
1 徐慧;刘会芬;肖德宝;熊磊;徐艳;;面向语义网的智能信息检索研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(下册)[C];2007年
2 李荣陆;张永奎;牛伟霞;;基于概念的信息过滤技术探讨[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前3条
1 朱鲲鹏;基于Web日志挖掘的智能信息检索研究[D];哈尔滨工业大学;2009年
2 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
3 杨月华;基于领域知识模型的突发事件智能信息检索系统研究[D];北京邮电大学;2013年
中国硕士学位论文全文数据库 前10条
1 傅赛香;基于Internet的智能信息检索技术研究[D];广西师范大学;2002年
2 韩晓光;基于语义网的智能信息检索[D];沈阳工业大学;2011年
3 李欣;基于概念检索的智能信息检索技术研究[D];华中师范大学;2004年
4 蔡敏;网络个性化信息服务系统设计与实现[D];武汉大学;2004年
5 邹景华;语义万维网在智能信息检索中的应用研究[D];重庆大学;2005年
6 杨小佳;基于本体的公共交通领域智能信息检索研究[D];大连海事大学;2007年
7 张志浩;基于本体论的语义检索研究[D];西安电子科技大学;2007年
8 滕岩;基于领域知识的智能信息检索研究[D];山东大学;2006年
9 李永喜;基于本体的智能信息检索研究[D];中国科学技术大学;2006年
10 杨宁宁;智能信息检索技术在医疗保险信息系统中的研究与实现[D];南京航空航天大学;2007年
中国重要报纸全文数据库 前5条
1 陈友梅;建一个内容仓库[N];中国计算机报;2004年
2 童铭;曾宇做互联网没的说[N];中国计算机报;2000年
3 李磊;让电子政务更聪明[N];计算机世界;2001年
4 中科院研究生院常务副院长 高文 本报记者 王光荣整理;科技奥运:中国人科技强国宣言[N];光明日报;2001年
5 本报记者 杜昊;内容管理:平地起风[N];计算机世界;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978