收藏本站
《武汉大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

XML数据流上基于窗口的查询处理方法研究

胡文生  
【摘要】:作为一种标准的通用标记语言,XML(eXtensible Markup Language)的半结构化特性、良好的可扩展性和自描述等特性使它已经成为了互联网上数据组织、表示和交换事实上的标准。而随着网络应用如Web服务、发布/订阅、个性化内容传递等的蓬勃发展,越来越多的信息和数据以XML的格式来编码与组织,并通过网络发布和交换,形成了一种新的数据处理模型—流计算模型。二者的结合带来两个基本问题:最优选择查询和多数据源之间的连接查询,导致迫切需要与之相适应的、能灵活高效地处理XML数据流上的查询处理技术。 本文围绕XML数据流的查询处理问题展开研究工作,在深入探讨目前XML数据流上查询处理研究成果的基础上,本着丰富XML数据流上的查询体系这一宗旨,实现XML数据流上查询处理灵活高效这一目的,选取XML单数据流上的Top-k查询和多数据流上连接查询进行了讨论和研究,提出了新的处理及优化方法,并通过实验验证了所提出方法的有效性和高效性。论文的主要贡献可以总结为如下几点: 1)提出一种在XML数据流上实现窗口查询简单可行的方法。与现有的少量研究工作相比,更好地兼顾了查询语言的表达能力和可行性两个方面,定义了窗口查询的简单语法,系统描述了在XML数据流上实现窗口查询的机制与方法。 2)提出一种处理XML数据流上Top-k查询的方法。将XML数据的相似性计算融入到数据的单遍扫描过程中,利用堆栈和优先队列等技术保证查询的高速处理,同时通过渐进结果生成的方法来尽快输出结果,提高结果反馈速度。 3)为了处理数据流的潜在无限性,提出一种XML数据流上基于窗口的Top-k查询处理模型,分析显示在一个非常小的错误概率允许范围内,结果输出所需空间较小,并且不依赖于XML数据流的速率。 4)提出一种处理XML多数据流连接查询优化的方法。以管道作业和类似路由器的处理方式保证查询的高速处理,并支持渐进的结果输出,针对不同环境影响因素均具有较高的优化效率。 综上所述,本文就XML数据流上的查询处理技术进行了深入的探讨和研究,提出了新的不同于已有的技术和方法,并通过实验对其有效性进行了验证。本文的研究工作,对于XML查询处理技术的发展,具有一定的理论意义与应用价值。
【学位授予单位】:武汉大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TP311.13

【参考文献】
中国期刊全文数据库 前2条
1 张昱;吴年;;一种逐层提升缓冲的XML流查询自动机[J];小型微型计算机系统;2007年03期
2 高军,杨冬青,唐世渭,王腾蛟;基于树自动机的XPath在XML数据流上的高效执行[J];软件学报;2005年02期
中国博士学位论文全文数据库 前3条
1 王桐;XML内容路由关键技术研究[D];哈尔滨工程大学;2006年
2 宫学庆;基于Bloom Filter的路径表达式查询处理[D];复旦大学;2006年
3 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
【共引文献】
中国期刊全文数据库 前2条
1 闫利国;贺飞;;XM L文档结构相似测度研究[J];计算机应用研究;2006年03期
2 崔屹;;基于XML数据查询问题的研究[J];辽宁大学学报(自然科学版);2006年01期
中国博士学位论文全文数据库 前5条
1 秦杰;Web环境中半结构化数据存储与查询技术研究[D];国防科学技术大学;2005年
2 王桐;XML内容路由关键技术研究[D];哈尔滨工程大学;2006年
3 陈德华;基于对等网络的分布式构件库系统若干关键技术研究[D];东华大学;2006年
4 丘宏俊;基于知识的飞机装配工艺设计关键技术研究[D];西北工业大学;2006年
5 袁家政;可伸缩矢量图形(SVG)的数据表示研究[D];北京交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 赖同庆;XML数据存储与检索研究[D];中南大学;2004年
2 李红梅;新制造环境下质量成本控制体系研究[D];中南大学;2003年
3 王小龙;数据流上的变化的挖掘算法研究[D];大庆石油学院;2006年
4 岳友友;XML查询技术研究[D];重庆大学;2006年
5 赵杰;个性化网络新闻服务中用户兴趣学习算法的研究[D];山东大学;2006年
6 金朋纬;XML缓存模型XCatche的研究与实现[D];四川大学;2006年
7 殷勤;可重构装配制造执行系统及其组件管理技术研究[D];上海海事大学;2006年
8 柳娜;统一资源管理系统中查询组件的设计与实现[D];湖南大学;2006年
9 马玉玲;一种新的基于向量空间的XML文档相似性度量方法及搜索技术[D];山东大学;2007年
10 韩秀娟;XML模式到关系模式的映射方法研究与改进[D];山东大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 付国宏,王晓龙;汉语词语边界自动划分的模型与算法[J];计算机研究与发展;1999年09期
2 张忠平,王超,朱扬勇;基于约束的XML文档规范化算法[J];计算机研究与发展;2005年05期
3 吴胜远;一种汉语分词方法[J];计算机研究与发展;1996年04期
4 孙茂松,左正平,黄昌宁;汉语自动分词词典机制的实验研究[J];中文信息学报;2000年01期
5 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
6 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
7 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
8 宫秀军,史忠植;基于Bayes潜在语义模型的半监督Web挖掘[J];软件学报;2002年08期
9 吕建华,王国仁,于戈;XML数据的路径表达式查询优化技术[J];软件学报;2003年09期
10 孟小峰,周龙骧,王珊;数据库技术发展趋势[J];软件学报;2004年12期
中国博士学位论文全文数据库 前1条
1 张忠平;基于约束的XML数据库模式规范化研究[D];复旦大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 张伟都,周海东,钟共鸣,张素伟;面向XML的数据管理系统[J];计算机工程与应用;2001年20期
2 李天庆,张毅,张冰,胡东成;基于XML的体育数据规格化存储技术研究[J];计算机工程与应用;2001年22期
3 张晓林;基于XML的信息组织与处理:1.XML技术体系[J];情报科学;2001年08期
4 李慧,何绍华;XML在图书馆系统中的实现技术[J];现代图书情报技术;2001年04期
5 谈春梅,段卫华,田质斌;标准文献数据库系统的设计与实现[J];现代图书情报技术;2001年06期
6 李景春,武港山,张福炎;基于转换的光盘文档库数据生成和浏览[J];小型微型计算机系统;2001年04期
7 周建洪,吴以群,庞引明,楼荣生;XML文件系统的设计[J];计算机工程与科学;2001年02期
8 袁琳,李秉严;SGML、HTML、XML的比较[J];四川图书馆学报;2001年03期
9 曹向东;基于JSP的数据访问技术[J];中国民航学院学报;2001年04期
10 李效东,顾毓清;基于DOM的Web信息提取[J];计算机学报;2002年05期
中国重要会议论文全文数据库 前10条
1 霍欢;王国仁;陈庆奎;彭敦陆;;基于Hole-Filler模型的XML数据流上的SLCA算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
2 郭志懋;周傲英;;XML数据的在线过滤[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 何震瀛;李建中;王宏志;;XML数据的关系存储[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
4 丁峰;王煜;姚延涛;沈钧毅;;从XML模式到数据库模式[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
5 谈子敬;施伯乐;;XML导出数据库表的实现与应用[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 罗道峰;孟小峰;;一种面向XML文档的基于角色的扩展访问控制方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
7 郑骏;王焱;钱卫宁;周傲英;;XML相似相关结构库的构造及其应用[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 吴刚;于亚新;王国仁;于戈;;并行XML文档数据分片技术研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
9 王静;孟小峰;王珊;;以目标节点为导向的XML路径查询处理[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
10 王鹏飞;洪晓光;;基于XML大文档的动态索引[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
中国重要报纸全文数据库 前10条
1 秦林;《XML完全探索》[N];中华读书报;2001年
2 本报记者 李瀛寰;XML推了网络一把[N];中国计算机报;2000年
3 ;分化并不能阻止XML发展[N];中国计算机报;2000年
4 ;为XML标准定标准[N];中国计算机报;2001年
5 IDG电讯;Microsoft、IBM共同制定XML标准[N];计算机世界;2000年
6 北京邮电大学 张剑;XML与HTML的结合(上)[N];计算机世界;2001年
7 本报记者 陆 杰;XML丛林的新秀[N];中华读书报;2002年
8 北京邮电大学 张剑;XML技术预览[N];计算机世界;2001年
9 北京邮电大学 张剑;XML与HTML的结合(下)[N];计算机世界;2001年
10 侯青;国际电子商务XML/EDI特点及现状[N];国际商报;2001年
中国博士学位论文全文数据库 前10条
1 胡文生;XML数据流上基于窗口的查询处理方法研究[D];武汉大学;2012年
2 朱小栋;基于扩展预测模型标记语言的数据流挖掘系统建模研究[D];南京航空航天大学;2009年
3 吴枫;数据流挖掘若干关键技术研究[D];国防科学技术大学;2009年
4 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
5 郭立超;数据流挖掘若干技术研究及其在电信行业的应用[D];浙江大学;2011年
6 李军;基于用户行为挖掘的数据流管理技术研究[D];北京邮电大学;2012年
7 王修君;高效数据流和海量文本处理算法研究[D];中国科学技术大学;2011年
8 欧阳震诤;不平稳数据流的分类技术研究[D];国防科学技术大学;2009年
9 冯博;基于半结构化数据的数据流挖掘算法研究[D];北京邮电大学;2011年
10 Mahmoud Sami Soliman;[D];中南大学;2010年
中国硕士学位论文全文数据库 前10条
1 范瑞英;基于LazyDFA的XML数据流查询优化技术研究[D];内蒙古科技大学;2009年
2 王虎;一种基于XML数据流查询算法的设计与实现[D];内蒙古科技大学;2011年
3 王虎;一种基于XML数据流查询算法的设计与实现[D];内蒙古科技大学;2011年
4 朱杰;基于主题和结构的XML网页的数据抽取[D];华侨大学;2005年
5 刘靖超;面向数据采集的信息集成系统设计与实现[D];河北工业大学;2005年
6 王旭磊;基于CBR的电子商务网站智能设计系统的研究[D];青岛大学;2005年
7 李志明;基于Web服务的在线考试系统应用研究与实现[D];广东工业大学;2005年
8 江静;基于XML的公文管理系统设计与应用研究[D];南京理工大学;2005年
9 陈美云;基于XML的柔性信息集成技术研究[D];山东科技大学;2005年
10 朱瑜;工作流引擎研究与实现[D];电子科技大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026