收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于元素链接的XML信息检索系统的研究

禹继波  
【摘要】: XML信息检索是在传统信息检索基础上发展起来的,是数据库领域和信息检索领域相结合的一门技术。研究表明,XML文档中的元素链接关系无论对元素的内容,还是结构都会产生重要影响,从而影响XML信息检索的结果。本文主要针对XML文档中的元素链接关系,从XML索引技术、XML信息检索模型和冗余信息削减等方面展开研究。 首先,提出了一种面向元素链接的XML索引技术,该索引包含两部分:文档外部链接索引和基于Pseudo Dewey编码的内部元素索引。其中Pseudo Dewey编码是一种基于schema的局部编码方式,每个元素的编码由该元素类型在schema中的位置和元素顺序等信息决定;内部元素索引本身则按照关键字类型、编码的逻辑大小等标准来组织结构。实验表明该索引具有支持元素链接、检索效率高、更新代价低等特点。其次,提出了一种基于图型建模的XML信息检索模型,该模型充分考虑了XML文档中元素链接关系对元素结构的影响;然后根据公共子序列的长度、位置和比重等因素来计算模型中上下文的相关性值,并得出该模型的上下文相关性矩阵;最后通过拓展传统向量空间算法来计算元素与用户检索语句的相关性,从而提高了检索结果的查准率和查全率。最后,建立了一种基于用户检索语句的Markov链用户浏览模型,并结合用户浏览历史记录和元素的上下文信息推导出该模型的转移概率矩阵;然后提出了一种基于结果集最优相关性的冗余信息削减技术及其贪心法优化方案,实验表明该贪心法优化方案时间消耗低,执行效率高,具有很好的实用价值。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 原福永;陈金森;林海霞;;基于XML的智能元搜索引擎研究[J];现代图书情报技术;2006年07期
2 胡亮,许永诚,高文,胡利平;一个高效的层次型搜索引擎模型及应用[J];计算机工程与设计;2005年08期
3 徐建民;柴变芳;姚冬磊;赵爽;;基于贝叶斯网络的XML文档查询模型[J];计算机工程;2006年15期
4 柴变芳;傅玥;安素芳;胡吉朝;;支持路径查询和信息检索的XML索引[J];软件导刊;2008年03期
5 郑轶媛;李治柱;;XML应用于信息检索的研究[J];计算机应用与软件;2006年12期
6 林馨;任仲晟;;一种新的XML信息检索索引[J];福建电脑;2008年09期
7 成岳鹏;朱松;金永涛;;一种新的面向XML信息检索的索引机制[J];北华航天工业学院学报;2008年06期
8 姚全珠;丁晓剑;任雪利;张志锋;;一种新的基于XML的索引机制[J];计算机工程;2006年15期
9 李万辉;林瑞明;张文德;;台湾科技文献信息抽取与检索平台的设计与实现[J];图书馆学研究;2010年12期
10 王知津;赵洪;;基于改进遗传算法的XML信息检索研究[J];图书馆杂志;2007年11期
11 梁作鹏,业宁,董逸生;PBC:一种基于路径的XML文档聚类方法[J];应用科学学报;2005年04期
12 肖燕;20世纪我国信息检索研究的历史回顾[J];图书馆学研究;1999年06期
13 叶鹰,马景娣,黄晨,朱聪,胡晓珍,刘琼;信息检索网上自助教学探索[J];大学图书馆学报;2000年02期
14 李慧敏,方敏,张雪梅;高校信息检索教育课教学改革构想[J];山东图书馆季刊;2001年02期
15 吴良凯;大学生信息检索教育的现状与对策[J];图书馆论坛;2003年05期
16 罗映红;基于网络的信息检索与信息检索能力的培养[J];高校图书馆工作;2004年02期
17 李其港;对高职信息检索课程教学改革的构思[J];职教论坛;2004年23期
18 李宙星;;浅析互联网信息超载[J];中国西部科技;2004年16期
19 陈璐;;亚马逊网络书店的信息检索[J];图书馆研究与工作;2004年04期
20 赖俊;周琳;张学平;;基于Web挖掘的主题式搜索引擎的设计[J];军事通信技术;2004年03期
中国重要会议论文全文数据库 前10条
1 郎君;刘挺;张会鹏;李生;;LTP:语言技术平台[A];第三届学生计算语言学研讨会论文集[C];2006年
2 郎君;刘挺;李生;张会鹏;;基于XML的开放式语言技术平台:LTP[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 温馨;王鹏;李少亮;郭文琪;陈群;娄颖;;基于关键字的XML信息检索反馈技术的研究[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
4 刘喜平;万常选;刘德喜;;有效的XML模糊内容与结构检索和计分[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
5 孙金立;李路路;王栋;;生物信息检索教学网的建设[A];向数字化转型的图书馆工作[C];2004年
6 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
7 孙金立;李路路;董明强;;建立生物信息检索教学网的研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
8 ;编者的话[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 米晓红;;一种基于LSI的用户兴趣模型构建方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
10 王敬成;;HNC农村智能信息检索系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年
2 王鑫印;无结构和半结构信息检索相关技术研究[D];复旦大学;2007年
3 吴定峰;基于本体的语义搜索模型研究[D];中国农业科学院;2012年
4 刘喜平;XML文档搜索中的查询处理技术研究[D];江西财经大学;2010年
5 董道国;高维数据索引结构研究[D];复旦大学;2005年
6 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
7 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
8 林古立;互联网信息检索中的多样化排序研究及应用[D];华南理工大学;2011年
9 马马杜 桑卡雷;基于多智能体的流体动力行业虚拟联盟信息检索的研究[D];浙江大学;2002年
10 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 王晓;电子病历智能全文检索研究[D];第四军医大学;2008年
2 曹鲁慧;远程教育中基于语义Web的信息处理技术研究[D];山东大学;2005年
3 陈金森;XML搜索引擎中索引技术的研究[D];燕山大学;2006年
4 潘奇;基于语言模型的XML信息检索的研究与实现[D];内蒙古大学;2010年
5 禹继波;基于元素链接的XML信息检索系统的研究[D];南京航空航天大学;2010年
6 乔智勇;Web数据挖掘系统的设计及关键技术研究[D];西安电子科技大学;2002年
7 杨才峰;基于自动分类的元搜索引擎的研究与应用[D];华北电力大学(河北);2005年
8 郭磊;P2P系统中的信息检索理论及应用研究[D];山东师范大学;2011年
9 宋海林;基于语言模型的信息检索中负反馈技术的研究与实现[D];内蒙古大学;2011年
10 管玉娟;基于智能Agent的个性化信息检索技术研究[D];西安建筑科技大学;2005年
中国重要报纸全文数据库 前10条
1 希安;微软试水信息检索[N];经济日报;2004年
2 叶静;开辟信息检索的新天地[N];人民邮电;2001年
3 本报记者 潘永花;组件化平台提升信息检索效率[N];网络世界;2003年
4 刘静一;个人档案信息检索[N];建筑报;2000年
5 秦林;《XML完全探索》[N];中华读书报;2001年
6 刘光强;搜索个人、企业、垂直三大搜索新进展[N];中国计算机报;2007年
7 柏荣;国家973项目在因特网大规模信息检索领域取得突破[N];中国高新技术产业导报;2003年
8 本报记者 李瀛寰;XML推了网络一把[N];中国计算机报;2000年
9 ;分化并不能阻止XML发展[N];中国计算机报;2000年
10 刘立新;信息社会技术前瞻[N];学习时报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978