时间序列数据挖掘研究
【摘要】:
作为一种新的数据分析工具,数据挖掘的发展十分迅速。各种类型的数据都可以作为数据挖掘的对象。时间序列在数据集中十分普遍。对时间序列进行数据挖掘已成为当前研究的焦点之一。
当前对时间序列数据挖掘的研究大部分集中在相似性研究方面,针对模式发现和规则发现的研究内容比较少。而且,这些研究很少考虑时间序列自身的复杂性。另外,对于时间序列数据挖掘过程中不确定性的处理尚待探讨。
本文主要研究了一种新的时间序列数据挖掘框架。该框架在挖掘过程中结合时序分析技术,引入了时序本身的内在特征,可以从时序中发现其背后系统的规律,并将其用于未来趋势的分析和预测。另外,本文用模糊集理论对时间序列数据挖掘过程中的不确定性进行了处理,提出了一种模糊时序数据挖掘的框架。本文的主要研究内容及成果如下:
1.基于状态空间重构技术提出了面向单一时序状态演化模式挖掘(SEPM)的框架。给出了有关的一系列概念,并对挖掘过程进行了详细研究,然后,将SEPM推广到多维时序。
2.提出了模糊模式有效支持度的概念,对其阈值的选取给出了有关的定理;基于有效支持度对模糊关联规则挖掘算法进行了改进;研究了SEPM中的不确定性,提出了模糊状态演化模式挖掘(FSEPM),并对实现过程进行了详细研究,接下来引入有效支持度的概念对FSEPM进行了优化。
3.通过实验分析,验证了FSEPM算法的有效性;分析了算法的关键参数对算法性能的影响。通过对FSEPM和SEPM进行对比试验,验证了FSEPM的优越性。