收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

分段时序查询优化方法研究

蒋涛  
【摘要】: 时序是一种不同于其它类型的序列数据,它通过在离散的时间点取样形成。它在现实世界的许多领域广泛存在,例如:生物医学、金融、气象学、自然科学等。时序处理技术是一种非常重要而有价值的技术,已经在许多重要领域成功应用,例如:传感器网络监控、金融数据分析、DNA序列分析、移动对象跟踪以及运动捕获等。然而,时序是一种典型的高维和海量类型数据,当前时序处理技术依然面临很大挑战。 围绕时序分段处理方法和分段时序的查询优化技术,展开了五个方面的研究工作:时序分段相关处理技术、基于聚类的静态分段时序的查询优化方法、基于分区的静态时序逆向近邻查询优化方法、动态分段时序的特定模式查询优化方法、基于网格的动态分段时序的相关模式查询优化方法。 由于时序分段在时序处理技术中具有重要意义,针对缺乏动态非等长时序分段方法的问题,在详细分析了静态时序和动态时序的等长和非等长分段方法的基础上,利用点对累积近似(Piecewise Aggregate Approximation, PAA)和点对线性近似(Piecewise Linear Approximation, PLA)的增量计算特性,给出了一种多数据流的自适应分段算法QONSP,并证明了它仅有线性的时间复杂度。实验结果表明,QONSP能对上千个动态时序进行自适应分段,通过调节参数可控制分段的精度和平均长度。 为了提高分段之后的静态时序的查询效率,研究了聚类对时序范围查询的影响。给出了一种基于等长分段的对称低边界函数SLBS,并证明了它下界于分段时序间的欧氏距离。利用SLBS,给出了基于聚类的静态时序范围查询优化方法RQIC,它同时集成了静态查询优化技术,包括:first-k过滤、三角不等式修剪以及低边界过滤。实验结果表明,RQIC在大部分数据集上保持了60%以上的修剪能力,且与PLA查询方法的查询性能接近。 针对当前缺乏基于B+树索引的静态分段时序查询优化方法,研究了分段静态时序的逆向近邻查询优化技术。通过利用静态分段时序具有的普遍适应的性质:任意两个不同时序,它们如果从整体上且(或)在局部趋势上保持相似,则它们将可能是靠近的对象,对静态时序进行分区,并根据分区大小和分区相似度进行分区分裂和合并,将分区后的时序对象索引到一颗B+树中。最后,在著名算法iDistance基础上,给出了基于过滤-精炼框架的查询优化方法RiDistance。实验结果表明,RiDistance是有效的,它的查询效率比序列扫描方法快1-2数量级。 在对分段之后的动态时序的查询处理方面,为了改进存在的模式匹配函数难以适应快速数据流模式长度和幅度变化的问题,研究了动态分段时序的特定模式查询优化方法。引入了一种新的模式相似距离函数,并证明它是一种度量函数,因而可以利用三角不等式加快模式匹配速度。同时给出了一种快速的模式匹配算法和一种基于统计信息预测可能出现的模式的概率算法。基于金融数据流的实验结果表明,给出的模式相似函数比其他同类函数更易适应幅度偏移和缩放的变化,查询方法能够监视大部分金融数据流中的特定模式。 进一步地,针对子序列匹配相关性查询的缺点以及缺乏动态环境下的主题发现算法,研究了基于网格技术的动态分段时序相关性查询优化方法。引入了能适应长度和幅度的变化的局部模式相似函数SDD,并证明了它满足度量函数特性。利用前述的动态分段技术和SDD,给出了基于网格投影技术的相关性模型MCALP,它能够监控多数据流中的最小相关(交叉相关)和最大相关(主题相关),并证明了它的两个提高查询效率的性能定理。该模型包括监视最小相关的查询方法MCPDG和P-主题查询方法PMDGS。基于金融数据流的实验结果表明,提出的查询优化方法是有效的,仅具有线性的时间和空间复杂度。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 金正淑,訾华亮,吕东方;分布式数据库系统中的查询优化[J];东北电力学院学报;2003年04期
2 李强;;数据库查询优化的几种策略[J];太原城市职业技术学院学报;2007年06期
3 邱小玲;;数据库查询优化提高网站访问速度[J];科技广场;2008年03期
4 陈可华;;一种基于量子遗传算法的分布式异构数据库查询优化方法[J];电脑知识与技术;2009年08期
5 殷贤亮,吴海;ORDBMS的新特性及其对查询优化的影响[J];华中科技大学学报(自然科学版);2001年12期
6 郑淑丽,韩江洪,蒋建文,吴永忠;多数据库集成环境下查询优化研究[J];微电子学与计算机;2004年06期
7 周金玲;多关系子句相关的查询优化[J];现代计算机;2004年05期
8 刘书炘,李正凡;基于分布式数据库系统的一种查询优化算法[J];北京联合大学学报;2005年01期
9 师宝山;尚展垒;张勇;;高校后勤保障管理系统中的查询优化[J];科技信息;2007年09期
10 杨尚森;白琳;;分布式数据库系统中的查询优化[J];洛阳大学学报;2007年02期
11 厉鹏;;数据库的查询优化[J];电脑知识与技术(学术交流);2007年16期
12 赵威;;XML代数查询优化研究[J];黑龙江科技信息;2008年01期
13 马李明;王守桃;徐艳蕾;;SQL语句的优化在提高数据查询中的应用[J];电脑知识与技术;2008年20期
14 段博超;;分布式数据库查询优化研究[J];科技资讯;2009年08期
15 王芳;轩春青;;关系数据库的查询优化[J];黑龙江科技信息;2009年28期
16 王海燕;;浅谈数据库查询优化技术[J];电脑知识与技术;2010年32期
17 张学义;王观玉;黄隽;;基于Oralce数据库SQL查询优化研究[J];制造业自动化;2011年02期
18 沈海峰;;简论关系数据库的查询优化[J];淮北职业技术学院学报;2011年01期
19 马新娜;樊金生;段淑凤;雷宇;;嵌入式实时数据库系统的研究与设计[J];微计算机信息;2006年23期
20 张孝;王珊;彭朝晖;;基于安全策略的一种数据保护方法及实现技术[J];计算机科学;2007年02期
中国重要会议论文全文数据库 前10条
1 邓韶勇;李磊;;一种基于散列的查询优化技术[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 黄杰;陈琳;贾焰;邹鹏;;文献数据库融合系统中基于文献内容的查询优化方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 韩萌;洪晓光;张勇;王文宜;;分层回溯用于数据库的查询优化[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
4 马垣;;特征值集合的完备性及其在查询优化中的应用[A];数据库研究进展97——第十四届全国数据库学术会议论文集(上)[C];1997年
5 江明菲;吴文明;陈祎祺;董逸生;;移动环境下的查询优化处理[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 王丙胜;李建中;;无线传感器网络的多查询优化[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
7 张淑芝;刘国华;聂俊岚;;广域传感器数据库中的多查询优化[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
8 吕彬;杜小勇;王琰;;基于属性相关性的SPARQL查询优化方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 邓江;徐秋元;李战怀;;工程数据库管理系统ANGEL的查询优化[A];数据库研究进展97——第十四届全国数据库学术会议论文集(下)[C];1997年
10 董玮;陈立军;黄炎灿;;数据流管理系统中基于选择算子分组的多查询优化(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国博士学位论文全文数据库 前10条
1 蒋涛;分段时序查询优化方法研究[D];华中科技大学;2010年
2 王秉卿;基于机器学习的查询优化研究[D];复旦大学;2012年
3 郑淑丽;Web信息集成系统及查询优化方法研究[D];合肥工业大学;2003年
4 李小敬;面向自治数据库的统计信息管理技术研究[D];浙江大学;2006年
5 江锦华;XML小枝模式查询处理技术研究[D];浙江大学;2009年
6 张博;基于XML索引和缓存的查询优化[D];复旦大学;2008年
7 丁晓锋;移动计算环境下非确定数据的索引与查询方法研究[D];华中科技大学;2008年
8 王小刚;异构信息集成环境中基于语义的查询研究[D];华中科技大学;2006年
9 阳国贵;对象关系数据库中若干关键技术的研究[D];中国人民解放军国防科学技术大学;2000年
10 陈荦;分布式地理空间数据服务集成技术研究[D];国防科学技术大学;2005年
中国硕士学位论文全文数据库 前10条
1 韩梅;数据库管理系统查询优化技术研究[D];解放军信息工程大学;2004年
2 李劲秋;基于主机的银行业务系统的实现与查询优化的研究[D];电子科技大学;2010年
3 徐洪禹;面向只读应用的分布式数据库的模型构造及查询优化的研究[D];大连理工大学;2000年
4 咸兵;物化视图研究与实现[D];清华大学;2006年
5 韩新超;XML数据的存储和查询的研究[D];燕山大学;2004年
6 陈洪波;嵌入式数据库系统查询机制研究与实现[D];重庆大学;2005年
7 王慧玉;基于分布式数据库系统查询优化的研究与应用[D];大连海事大学;2005年
8 孙宁;一个企业管理信息系统的设计与优化[D];华中科技大学;2005年
9 王慜;基于PAT代数的XML数据查询优化方法研究[D];兰州理工大学;2011年
10 张仕;XML数据管理系统的研究与实现[D];南京航空航天大学;2003年
中国重要报纸全文数据库 前10条
1 本报记者 潘永花;解放数据库管理员[N];网络世界;2004年
2 王锐 白玲 龙波 马德涛;何为空间数据挖掘[N];中国测绘报;2007年
3 易水;计算机专业时文选读(898)[N];计算机世界;2002年
4 ;自主计算下的数据库 让人省心[N];中国计算机报;2003年
5 金颖云;随身携带的数据库[N];网络世界;2002年
6 邹大斌;关注商业智能的性能[N];计算机世界;2007年
7 ;Sybase与Linux完美结合[N];网络世界;2001年
8 ;国产数据库“走江湖”[N];计算机世界;2004年
9 沈建苗;实时追踪了如指掌[N];中国计算机报;2002年
10 本报记者 中国人民大学信息学院 王珊 张坤龙;网格环境下的数据库系统[N];中国计算机报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978