收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于lazyDFA的XML数据流查询处理及优化技术研究

崔敏  
【摘要】: 随着金融证券管理、Internet流量监控、Web使用日志等新型应用领域对数据的管理与分析提出了新的要求,数据流及其相关技术已经成为当前数据处理领域的研究热点之一。由于XML语言已经成为互联网上信息表示和数据交换的重要标准,所以也就相应地出现了大量的XML数据流相关应用,比如基于内容的XML路由、Web服务、主动服务中的订阅和发布系统等。在这些应用系统中,XML数据是以流的形式不断地快速到达的。因此对XML数据流进行管理和分析的理论和技术又成为目前数据流研究领域中的一个热点。 XML数据流处理系统都是运行在Internet环境中的,该环境下的用户是海量的,海量的用户利用XPath查询语句描述其需求,那么如何在XML数据流上执行海量的XPath查询便成为XML数据流应用中一个迫切需要解决的问题,因此本文选择该部分进行研究。 本文结合XMI数据流处理中每个XML结点最多只能访问一次、处理算法具有尽可能小的空间复杂度、每个结点的处理必须具有很高的时间效率以满足实时处理需要的特点;分析和研究了目前解决XML数据流上查询处理的方法和实现机制;根据XPath语法规则,即任意一个XPath路径表达式都可转化成一个正则表达式,基于自动机理论,完成了NFA和lazyDFA的构造,实现了XPath表达式的查询处理,并为提高自动机的查询效率提出了前缀路径共享、共享NFA状态表、建立状态转移表、基于DTD语义信息和基于DTD结构信息的五种优化算法。 最后对本文构造的自动机及其优化算法进行了性能测试,实验结果表明自动机技术可以有效地处理XML数据流上的海量XPath查询表达式,而且优化算法也可以有效地提高自动机的查询效率。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 冯静;余建桥;李雪娇;;寻找XLCA的XML数据流TOP-K关键字查询算法[J];计算机技术与发展;2011年09期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国博士学位论文全文数据库 前2条
1 宫学庆;基于Bloom Filter的路径表达式查询处理[D];复旦大学;2006年
2 王宏志;XML数据查询处理技术的研究[D];哈尔滨工业大学;2008年
中国硕士学位论文全文数据库 前8条
1 秦玉华;基于谓词的XML数据流查询处理研究[D];哈尔滨工程大学;2008年
2 崔敏;基于lazyDFA的XML数据流查询处理及优化技术研究[D];内蒙古科技大学;2008年
3 李宏辉;基于下推自动机的XML数据流递归查询处理技术研究[D];内蒙古科技大学;2009年
4 翟国锋;基于XML Schema的XML数据流压缩技术研究[D];内蒙古科技大学;2009年
5 张宏伟;XML数据流的XPath查询算法研究[D];中国石油大学;2007年
6 刘景超;XML数据流XPath查询模型研究[D];湖南师范大学;2009年
7 刘海东;基于XML的数据共享与查询技术及其应用研究[D];扬州大学;2008年
8 黎立文;XPath查询模型研究[D];湖南师范大学;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978