收藏本站
《中国科学院研究生院(文献情报中心)》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

XML引擎研究

向桂林  
【摘要】: XML从1998年由W3C(World Wide Web Consortium)提出之后已得到广泛的关注,各行各业都在采用XML来描述本领域的信息,比如MathML、CML、VoiceML等,随之而来的问题是产生大量XML文档,应该如何管理这些XML文档就成为一个迫切需要解决的现实问题。XML引擎研究就是根据这个问题提出的研究课题。本文所做的主要工作有: (1) XML引擎原型设计。本文设计了一个XML引擎框架,研究了XML引擎与XML数据库、XML应用系统之间的关系,以及XML引擎存储系统、索引系统和查询系统的各种功能。存储系统为索引系统提供存储支持,为查询系统提供临时文件的存储,比如索引文件、索引使用的参数文件等;同时查询系统获取源数据时需要访问存储系统。索引系统分为内容索引和结构索引两部分。索引系统主要为查询系统服务,为查询系统实现全文查询、布尔查询、路径查询提供支撑;索引系统还提供一些接口,使得外部程序可以不经过查询系统也能访问索引系统。查询系统分为内容查询和结构查询两部分。查询系统遵守XPath语法,在实现结构查询功能的同时,也把XML文档看作一般的文本文件来处理,提供内容查询功能。 (2) XML索引技术研究。本文研究了对XML文档进行内容索引和结构索引的方法,尤其是内容索引和结构索引的有机结合机制。在内容索引技术中研究了三个问题,即变长记录存储问题,中文词、英文短语的索引问题,提高索引建立速度的问题。本文提出的结构索引技术采用了四个索引文件来完成对XML文档的内容索引和结构索引,研究了四个索引文件的建立方法。针对结构索引的建造,本文首先阐明了前序一后序节点标号法,然后提出了树邻接表的概念,并给出了把DOM树转换为树邻接表的办法;最后对树邻接表进行前序-后序遍历,得到每个节点的标号,并组装成结构索引文件。 (3) XML查询技术研究。本文研究了对XML文档进行内容查询和结构查询的办法,关键是研究了内容查询和结构查询的有机结合机制。本文研究了内容查询技术中的三个问题,即简单检索、字段检索和布尔检索。在研究结构查询技术时,本文提出了五种基本的路径表达式,即简单路径表达式、含序路径表达式、属性路径表达式、含值路径表达式和K C路径表达式,本文研究了这五种基本路径表达式的实现方式,通过分析这五种路径表达式的实现,笔者提出了四种针对结构信息的基本操作,即PC操作、AD操作、CO操作和OR操作。 在研究方法上,本文综合应用了文献调查方法、逻辑推理方法、归纳总结法和实证法。针对不同的研究内容,采用不同的研究方法,确保研究过程和研究结果的真实与可靠。
【学位授予单位】:中国科学院研究生院(文献情报中心)
【学位级别】:博士
【学位授予年份】:2004
【分类号】:TP312

知网文化
【引证文献】
中国博士学位论文全文数据库 前1条
1 李新叶;基于XML文档结构语义的信息检索方法与应用研究[D];华北电力大学(河北);2009年
中国硕士学位论文全文数据库 前2条
1 孔晓霞;基于Web服务动态集成的移动电子商务软件平台的设计与应用[D];中国海洋大学;2005年
2 邓方红;基于银联二代综合卡系统的研究与实现[D];江西师范大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 文枫;XML应用大潮即将到来[J];互联网周刊;2003年09期
2 孟小峰;Web数据管理研究综述[J];计算机研究与发展;2001年04期
3 张素智,卢正鼎,李春林;XML数据库及其应用研究[J];计算机工程与应用;2002年08期
4 陈奇;XSLT、XPath和DOM的应用研究[J];计算机工程;2003年03期
5 徐德智,滕婧;XML数据的B树存储实现及更新[J];计算技术与自动化;2002年03期
6 周建洪,吴以群,庞引明,楼荣生;XML文件系统的设计[J];计算机工程与科学;2001年02期
7 徐德智,吴敏,赖同庆;XML模式、查询和存储技术扫描[J];计算机工程与科学;2003年03期
8 张璞,庄成三;XML查询语言技术与实例分析[J];计算机应用研究;2000年05期
9 王海波,姜吉发,耿晖,白硕,祝明发;XML搜索引擎研究[J];计算机应用研究;2001年04期
10 李由,黄凯歌,汤大权;XML的数据库存储技术研究[J];计算机应用研究;2002年04期
【共引文献】
中国期刊全文数据库 前10条
1 连剑波;刘任;刘杰;;XML数据库在蔬菜病虫害信息发布平台中的应用[J];安徽农业科学;2010年04期
2 刘玫瑾;;体育人才数据库的设计与应用[J];办公自动化;2008年22期
3 陈寒江,吴相林;基于XML的数据库系统研究[J];兵工自动化;2003年02期
4 罗维维;浅议数字图书馆建设中的几个问题[J];国家图书馆学刊;2001年03期
5 王志庚,郝守真;网络文献保存的实践和课题[J];国家图书馆学刊;2004年02期
6 李海军;校务信息化中的文档一体化建设实践[J];北京大学教育评论;2005年S1期
7 刘玫瑾;;全国体育人才状况调研系统的研究[J];北京体育大学学报;2006年09期
8 毛学群;中小型图书馆数字化对策[J];图书与情报;2001年01期
9 文庭孝;情报检索中汉语语词自动切分研究[J];图书与情报;2001年02期
10 吴玉丰;《中国学术期刊(光盘版)》的检索方法[J];图书与情报;2003年01期
中国重要会议论文全文数据库 前10条
1 何璐;李晋宏;;基于XML的大容量搜索引擎技术探讨[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
2 林英;;谈谈中国数字图书馆的研究、开发与建设[A];福建省图书馆学会2002年学术年会论文集[C];2002年
3 姚明溪;;论数字图书馆建设[A];福建省图书馆学会2009年学术年会论文集[C];2009年
4 盛作国;胡红;;情报推理的逻辑理论工具——制约逻辑在情报科学中的应用[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
5 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
6 李俊;方胜良;刘湘伟;周明;;基于XML的电子对抗军事想定数据交换格式设计[A];'2008系统仿真技术及其应用学术会议论文集[C];2008年
7 陈虹涛;李志俊;;我国数字图书馆的发展及面临的障碍[A];陕西省图书馆学会第五次会员代表大会暨学术研讨会与全国图书馆部室主任工作、学术研讨会论文集[C];2003年
8 廉成洋;毛宇光;;一种基于二叉树的HTML到XML的转换方法研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
9 ;A Dynamic XML-NS View Based Approach for the Extensible Integration of Web Data Sources[A];Proceedings of the First Conference on Web Information System and Applications[C];2004年
10 张晶;张云生;;基于XML的实时数据一致性查询机制[A];全国炼钢连铸过程自动化技术交流会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 汪陈应;XML数据编码与存储管理关键技术研究[D];南开大学;2010年
2 蔺旭东;基于语义的XML查询及规范化研究[D];北京交通大学;2010年
3 陈曦;基于子串的文本分割与主题标注研究[D];武汉大学;2009年
4 黎方正;关系数据库的关键词检索技术研究[D];中南大学;2010年
5 汤华茂;基于语义的产业链网络化协同设计模式及关键技术研究[D];重庆大学;2010年
6 刘瑰;面向海量信息处理领域的数据网格及其关键技术研究[D];解放军信息工程大学;2009年
7 聂铁铮;Deep Web中Web数据库集成关键技术的研究[D];东北大学;2009年
8 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年
9 孙坦;数字图书馆理论与发展模式研究[D];中国科学院文献情报中心;2000年
10 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年
中国硕士学位论文全文数据库 前10条
1 王强;基于演示编程的遥感图像元数据提取方法研究[D];山东科技大学;2010年
2 刘倩;一种网络环境下的异构数据资源一体化方法[D];山东科技大学;2010年
3 夏光磊;关于XML的关系数据库存储查询技术研究[D];山东科技大学;2010年
4 孙明帅;面向NSSA的异构数据规范化处理与集成[D];哈尔滨工程大学;2010年
5 赵晓静;基于.NET技术的汽车4S店管理系统的设计与实现[D];中国海洋大学;2009年
6 董铭彦;基于SaaS的科技园招商CRM系统的研究与设计[D];苏州大学;2010年
7 范春晓;基于XML的Web信息抽取技术研究[D];沈阳理工大学;2010年
8 夏云龙;基于模板的代码自动生成系统的研究与实现[D];沈阳理工大学;2010年
9 张麟;XML数据查询优化技术的研究[D];哈尔滨理工大学;2010年
10 何卫东;出入境海港口岸管理系统[D];华南理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 万博,彭秀艳,李永亮,王凤阳;基于XML的数据交换在变电站自动化中的应用[J];东北电力学院学报;2003年01期
2 金正淑,王彦彬,范小玲;基于XML的电力企业管理中异构数据共享[J];东北电力学院学报;2005年01期
3 潘长胜,于浩海,王光兴;Web Services动态整合的体系结构和算法[J];东北大学学报;2003年05期
4 杨武,丁丹,荣命哲,陈德桂,贾申利;高压开关柜的在线监测和故障诊断[J];电工技术杂志;2001年03期
5 曹阳,姚建国,张慎明,黄海峰;XML技术在电网自动化系统中的应用探讨[J];电力系统自动化;2002年21期
6 张慎明,卜凡强,姚建国,杨志宏,陈梅,赵京虎,曹阳;遵循IEC61970标准的实时数据库管理系统[J];电力系统自动化;2002年24期
7 林济铿,罗萍萍,曹绍杰,C.M.MAK,K.M.YUNG;基于数据挖掘技术的负荷曲线对故障反应相似性的研究[J];电力系统自动化;2005年01期
8 杨争林,宋燕敏,曹荣章;基于Web Services技术的数据申报实现[J];电力系统自动化;2005年04期
9 李荔芳;刘东;陈清鹤;;公共信息模型在配电网建模工具中的应用[J];电力系统自动化;2005年24期
10 廖瑞金;王谦;骆思佳;廖玉祥;孙才新;;基于模糊综合评判的电力变压器运行状态评估模型[J];电力系统自动化;2008年03期
中国博士学位论文全文数据库 前2条
1 曲卫民;中文XML信息检索系统的研究[D];中国科学院研究生院(软件研究所);2004年
2 李新叶;基于XML文档结构语义的信息检索方法与应用研究[D];华北电力大学(河北);2009年
中国硕士学位论文全文数据库 前10条
1 李伟;XML和中间件技术在现代供应链管理系统中的应用[D];昆明理工大学;2002年
2 郭永明;XML文档检索技术研究[D];太原理工大学;2003年
3 郭倩;基于XML与Web Services的企业门户技术研究与实现[D];中国人民解放军国防科学技术大学;2002年
4 孙登峰;XML文档信息检索技术研究与实现[D];中国人民解放军国防科学技术大学;2002年
5 潘敏;动态集成的移动电子商务平台的设计与研究[D];浙江大学;2004年
6 邹娟;企业应用集成中信息门户技术研究与开发[D];西安电子科技大学;2004年
7 谈猛刚;基于企业门户的应用集成研究[D];中国科学院研究生院(软件研究所);2004年
8 张存明;变电设备状态分析及管理信息系统[D];华北电力大学(河北);2004年
9 李霞;MVC设计模式的原理与实现[D];吉林大学;2004年
10 刘涛;移动电子商务平台的研究与开发[D];中南大学;2004年
【二级引证文献】
中国期刊全文数据库 前1条
1 朱林华;;Web安全防范问题的研究[J];硅谷;2010年01期
中国硕士学位论文全文数据库 前4条
1 程俏;电子商务订单实时处理的在线协商集成平台研究[D];大连理工大学;2007年
2 刘玉红;基于SMS和WAP Push的移动商务系统的设计与实现[D];中国海洋大学;2007年
3 吴江寿;农业科技信息移动服务系统设计与实现[D];中国农业科学院;2009年
4 邓方红;基于银联二代综合卡系统的研究与实现[D];江西师范大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 郭瑞华;谈数字图书馆元数据的制作[J];北京图书馆馆刊;1999年03期
2 张辉;XML与Web数据管理技术[J];电脑开发与应用;2001年02期
3 孟小峰;Web数据管理研究综述[J];计算机研究与发展;2001年04期
4 张素智,卢正鼎,李春林;XML数据库及其应用研究[J];计算机工程与应用;2002年08期
5 卢海鹏;周之英;;WWW应用与标记语言[J];计算机科学;1999年01期
6 杨冬青;裴健;唐世渭;;未来十年数据库系统研究方向——Asilomar报告[J];计算机科学;1999年09期
7 李由,肖卫东,徐振宁,汤大权,黄凯歌;XML数据库存储技术的研究与实现[J];计算机工程;2002年07期
8 徐德智,滕婧;XML数据的B树存储实现及更新[J];计算技术与自动化;2002年03期
9 周建洪,吴以群,庞引明,楼荣生;XML文件系统的设计[J];计算机工程与科学;2001年02期
10 张璞,庄成三;XML查询语言技术与实例分析[J];计算机应用研究;2000年05期
【相似文献】
中国期刊全文数据库 前10条
1 张伟都,周海东,钟共鸣,张素伟;面向XML的数据管理系统[J];计算机工程与应用;2001年20期
2 李天庆,张毅,张冰,胡东成;基于XML的体育数据规格化存储技术研究[J];计算机工程与应用;2001年22期
3 张晓林;基于XML的信息组织与处理:1.XML技术体系[J];情报科学;2001年08期
4 李慧,何绍华;XML在图书馆系统中的实现技术[J];现代图书情报技术;2001年04期
5 谈春梅,段卫华,田质斌;标准文献数据库系统的设计与实现[J];现代图书情报技术;2001年06期
6 李景春,武港山,张福炎;基于转换的光盘文档库数据生成和浏览[J];小型微型计算机系统;2001年04期
7 周建洪,吴以群,庞引明,楼荣生;XML文件系统的设计[J];计算机工程与科学;2001年02期
8 袁琳,李秉严;SGML、HTML、XML的比较[J];四川图书馆学报;2001年03期
9 曹向东;基于JSP的数据访问技术[J];中国民航学院学报;2001年04期
10 李效东,顾毓清;基于DOM的Web信息提取[J];计算机学报;2002年05期
中国重要会议论文全文数据库 前10条
1 郭志懋;周傲英;;XML数据的在线过滤[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 何震瀛;李建中;王宏志;;XML数据的关系存储[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 丁峰;王煜;姚延涛;沈钧毅;;从XML模式到数据库模式[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
4 谈子敬;施伯乐;;XML导出数据库表的实现与应用[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 罗道峰;孟小峰;;一种面向XML文档的基于角色的扩展访问控制方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 郑骏;王焱;钱卫宁;周傲英;;XML相似相关结构库的构造及其应用[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 吴刚;于亚新;王国仁;于戈;;并行XML文档数据分片技术研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 王静;孟小峰;王珊;;以目标节点为导向的XML路径查询处理[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
9 王鹏飞;洪晓光;;基于XML大文档的动态索引[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 肖冰;廖湖声;郑玉明;;数据集成系统中的XML延迟处理技术[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国重要报纸全文数据库 前10条
1 秦林;《XML完全探索》[N];中华读书报;2001年
2 本报记者 李瀛寰;XML推了网络一把[N];中国计算机报;2000年
3 ;分化并不能阻止XML发展[N];中国计算机报;2000年
4 ;为XML标准定标准[N];中国计算机报;2001年
5 IDG电讯;Microsoft、IBM共同制定XML标准[N];计算机世界;2000年
6 北京邮电大学 张剑;XML与HTML的结合(上)[N];计算机世界;2001年
7 本报记者 陆 杰;XML丛林的新秀[N];中华读书报;2002年
8 北京邮电大学 张剑;XML技术预览[N];计算机世界;2001年
9 北京邮电大学 张剑;XML与HTML的结合(下)[N];计算机世界;2001年
10 侯青;国际电子商务XML/EDI特点及现状[N];国际商报;2001年
中国博士学位论文全文数据库 前10条
1 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
2 叶晓峰;基于XML的冲压模具设计知识重用技术研究[D];华中科技大学;2010年
3 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
4 张晨静;XML关键字过滤技术[D];复旦大学;2011年
5 胡文生;XML数据流上基于窗口的查询处理方法研究[D];武汉大学;2012年
6 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年
7 汪源;XML事务模型及并发控制研究[D];浙江大学;2006年
8 许建军;对结构化和半结构化数据的关键字搜索研究[D];复旦大学;2007年
9 刘喜平;XML文档搜索中的查询处理技术研究[D];江西财经大学;2010年
10 李荷华;面向智能体的化工过程运行系统信息集成模型研究[D];华南理工大学;2003年
中国硕士学位论文全文数据库 前10条
1 朱杰;基于主题和结构的XML网页的数据抽取[D];华侨大学;2005年
2 刘靖超;面向数据采集的信息集成系统设计与实现[D];河北工业大学;2005年
3 王旭磊;基于CBR的电子商务网站智能设计系统的研究[D];青岛大学;2005年
4 李志明;基于Web服务的在线考试系统应用研究与实现[D];广东工业大学;2005年
5 江静;基于XML的公文管理系统设计与应用研究[D];南京理工大学;2005年
6 陈美云;基于XML的柔性信息集成技术研究[D];山东科技大学;2005年
7 朱瑜;工作流引擎研究与实现[D];电子科技大学;2005年
8 谢红;XML技术和B/S模式在职业教育与培训管理信息系统中的应用研究[D];重庆大学;2005年
9 郦金花;基于XML的MARC发布系统的设计与实现[D];苏州大学;2005年
10 沈剑沧;XML查询方法研究[D];华东师范大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026