收藏本站
《东华大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于分形的非平稳时间序列挖掘关键技术研究

孙梅玉  
【摘要】: 随着计算机信息系统的日益普及,人们在日常事务处理和科学研究中积累了大量的各种类型的数据。在这些保存的数据中,绝大部分都是时间序列类型的数据,如金融证券市场中,每天的股票价格变化;零售行业POS系统中,某种商品每天的销售额;气象预报研究中,某一地区的每天气温与气压的读数以及生物医学中,某一症状病人在每个时刻的心跳变化等。如何对这些海量的时间序列数据进行分析处理,从中挖掘出蕴藏在数据信息背后的客观规律,这对于我们揭示事物发展变化的内部规律,发现不同事物之间的相互作用关系,为人们正确认识事物和科学决策提供依据等都具有十分重要的现实意义。在这种需求的大力推动下,时间序列数据挖掘就是为解决这一问题而出现的一种新型数据分析技术。利用时间序列数据挖掘技术,得到数据中蕴含的与时间相关的有用信息,实现知识的发现与规则的提取。 本文针对非平稳时间序列数据挖掘技术中的时间序列表示方法、相似性查找、时间序列距离度量、序列分类和异常检测等关键技术进行了深入的分析研究。将网格和分形技术应用到非平稳时间序列挖掘任务中,既保留了时间序列的非线性和分形的重要特征,同时又实现了维度的约简。论文主要研究内容和创新点如下: 1)时间序列表示方法研究 首次将网格思想应用到MBR(minimum bounding rectangle)中,提出了一种基于MBR的高效时间序列表示法GMBR(Grid Minimum Bounding Rectangle),同时将分形思想首次应用到APCA(Adaptive Piecewise Constant Approximation)中,提出了一种高精度的基于分形和符号化的时间序列表示方法FSPA(FractalSymbolic Piecewise Approximation),前一种方法是将网格的思想引入到MBR中,能够保证在低开销的情况下有效提高查找的准确性;后一种方法是将分形理论和R/S方法应用到现有的时间序列表示方法中,既保留了时间序列的非线性和分形的重要特征,同时也实现了维度的约简。实验数据表明,这两种方法在相似性查找和分类任务等多种挖掘任务中均具有较高的效率。 2)时间序列的距离度量方法研究 分别提出了基于GMBR和FSPA表示法的时间序列距离度量公式,并给出了理论证明,证明了用我们所给出的距离度量公式计算两个时间序列间的距离要比原始序列间的欧式距离小,从而证明了这两种时间序列表示方法的可用性;这两种距离度量公式均以简约后的欧式距离公式为基础,基于GMBR的距离度量公式引入位运算,容易快速地计算出序列间的距离,且通常这些运算都可以通过硬件来实现;基于FSPA表示法的距离度量将分形维度应用到距离度量中,大大增加了时间序列相似性查找的精度。本文还给出了相似性挖掘任务的算法描述,通过实验数据表明,这两种方法在时间序列的相似性挖掘任务中具有较高的精度且需要较少的存储空间。 3)时间序列的分类问题研究 提出了基于FSPA表示法的时间序列分类方法。该分类方法引入了分形技术,能够有效地保留原序列的重要特征,同时将时间序列进行符号化表示,具有比初始数据低的距离度量。该分类方法共分为两步,首先利用分形和符号化的时间序列表示方法进行数据的转化,将数据转化成等长向量,然后在经过转化的等长数据集上使用一般的分类算法进行分类。将本文算法与领域无关算法进行了比较,并从训练样本大小、序列长度和噪声对两种算法的影响三个方面进行了分析研究。实验结果表明在训练数据较少时,使用本文提出的领域相关算法比较合适:另一方面,领域无关的算法受噪声的影响相对较少。 4)时间序列异常检测研究 在时间序列的GMBR表示的基础上,本文首次提出将基于距离和基于密度的时间序列检测方法结合,给出了时间序列模式异常的定义,并用“异常特征值”来衡量时间序列模式的异常程度。根据本文所提出的模式异常的定义,在强力搜索算法的基础之上提出了新的时间序列异常检测算法GMBR-DD(Grid Minimum BoundingRectangle-Discords Detect),该算法将基于距离和基于密度的异常检测方法结合,能够高效地发现时间序列中的异常模式。通过三组实验数据,对本文提出的异常时间序列定义和时间序列的异常检测算法进行了验证,实验结果表明本文所提出的时间序列异常检测算法能够有效地发现时间序列的异常变动,为决策提供了很好的平台和有力的工具。
【学位授予单位】:东华大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP311.13

【相似文献】
中国期刊全文数据库 前10条
1 周美莲;一个分形图形获取的趣例[J];计算机应用;1994年02期
2 刘勍,张在峰,马义德,袁敏;基于分形理论的图像压缩编码技术[J];信息与电子工程;2004年04期
3 高建清;Delphi中实现分形绘图[J];福建金融管理干部学院学报;2005年01期
4 王俊生,甘强,韦钰;分形细胞神经网络用于联想记忆[J];电子学报;1997年02期
5 王舟,王哲,余英林;余域中分形方块编码的一种快速解码结构[J];电子学报;1997年10期
6 亢宽盈;分形理论的创立、发展及其科学方法论意义[J];科学管理研究;1998年06期
7 朱红;图像分形特征提取的快速算法[J];西安电子科技大学学报;1998年01期
8 丁保华,李文超,王福明;分形图像分析与分形维数计算程序的设计[J];北京科技大学学报;1999年03期
9 姜楠,高旭;分形在工业设计中的应用[J];河海大学学报(自然科学版);1999年01期
10 朱红,赵亦工;一种图像分形特征提取的近似算法[J];西安电子科技大学学报;1999年02期
中国重要会议论文全文数据库 前10条
1 唐明;巴恒静;;基于分形理论的混凝土孔隙特征研究[A];高性能混凝土的研究与应用——第五届全国高性能混凝土学术交流会论文[C];2004年
2 郑洪龙;吕英民;董绍华;;腐蚀管道评定方法研究——对B31G公式的分形修正[A];第十二届全国疲劳与断裂学术会议论文集[C];2004年
3 高福聚;刘锡良;;建筑结构工程中的分形和标度现象[A];第十届全国结构工程学术会议论文集第Ⅲ卷[C];2001年
4 郭万林;李天文;;分形在钎焊领域中的应用[A];第十次全国焊接会议论文集(第1册)[C];2001年
5 杨文;孙洪;何勇;徐戈;;基于分形的SAR图像人造目标检测[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
6 梁军林;;水泥混凝土路面分形疲劳破坏机理及应用研究[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
7 侯振德;秦玉文;;分形相关法位移测量的研究[A];“力学2000”学术大会论文集[C];2000年
8 曹宁;宋扬;沙济彰;;自组织特征映射网络在分形图象编码中的应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
9 张飞;周海东;赵云霞;巴蕾;;岩石细观损伤的三维数字图像分形[A];岩石力学与工程的创新和实践:第十一次全国岩石力学与工程学术大会论文集[C];2010年
10 赵歆波;邹晓春;赵荣椿;;一种计算各向异性分形维数的新方法[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
中国重要报纸全文数据库 前10条
1 袁佳丽 高建敏;探索的脚步[N];科技日报;2011年
2 李建国;致力于微电子电路与系统研究[N];科技日报;2007年
3 何雨锋;构建超循环与分形的体系结构[N];中国国防报;2010年
4 财经前导网 凌颢华;四月大3浪尾部延伸[N];中国证券报;2007年
5 财经前导网 凌颢华;谨慎观望二次回探[N];中国证券报;2008年
6 陈璧羡;中医的科学基础和科学方法[N];中国中医药报;2004年
7 苏恩泽;军人思维要比科技杂志更敏锐[N];中国国防报;2007年
8 凌颢华;周波子浪上升仍将延续[N];中国证券报;2007年
9 张晔 王燕宁;陶醉于非线性之美[N];科技日报;2006年
10 本报记者 张文;追寻数据背后的经济思想[N];21世纪经济报道;2003年
中国博士学位论文全文数据库 前10条
1 孙梅玉;基于分形的非平稳时间序列挖掘关键技术研究[D];东华大学;2009年
2 赵歆波;基于分形的从明暗恢复形状方法研究[D];西北工业大学;2002年
3 毛玉星;小波域图像与视频压缩算法及应用研究[D];重庆大学;2003年
4 戚大伟;基于分形理论的原木缺陷X射线图像分析与处理[D];东北林业大学;2003年
5 陈永忠;我国股市非线性时间序列分析[D];华中科技大学;2004年
6 朱毅;广义非线性Schr(?)dinger方程中孤立波的弱相互作用[D];清华大学;2008年
7 李建军;股票市场的分形特征和股票价格的FIGARCH模型研究[D];中国社会科学院研究生院;2002年
8 陈刚;高能强子-强子与电子-正电子碰撞中的非线性动力学起伏与喷注的非线性性质的研究[D];华中师范大学;2002年
9 沙智华;基于拟实体数控车削加工仿真研究[D];大连交通大学;2005年
10 张海林;提高散体有效导热系数模型准确度的理论与实验研究[D];华北电力大学(河北);2004年
中国硕士学位论文全文数据库 前10条
1 于光辉;基于分形和小波的几种图象编码方法的研究[D];北京工业大学;2000年
2 邢志鹏;液压设备故障诊断的分形方法研究[D];广东工业大学;2003年
3 张兵;非饱和土水力参数的分形模型[D];西南农业大学;2003年
4 于红志;分形图形生成研究[D];大连理工大学;2003年
5 王何宇;对与分形相关的若干科学计算论题的研究[D];浙江大学;2003年
6 庹红娅;分形图像压缩的研究[D];西北工业大学;2002年
7 黄波;分形图形生成的方法和表现[D];北方工业大学;2004年
8 鲁凡;基于分形理论的自动摘要[D];吉林大学;2004年
9 周运红;自然景物建模及图像压缩分形反问题的研究[D];大连理工大学;2000年
10 孙炜;基于分形理论的数字水印技术研究[D];广东工业大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026