收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

时间序列相似性问题研究

李俊奎  
【摘要】: 时间序列相似性问题是时间序列挖掘中的一个重要而基础的问题,为其他的挖掘手段提供必要的技术支持和手段,也经常作为其他挖掘问题的一个子程序,自从提出以来一直是一个备受关注的研究热点问题。 围绕静态时间序列比较、动态时间序列匹配等方面,开展了六方面的研究工作:时间序列建模、静态时间序列的相似比较、动态时间序列的相似匹配、时间序列相似比较的提前终止和效率估算、相似序列的排序以及相似序列搜索原型系统的研究。 为改变当前时间序列建模表示方法缺少时间特征的现状,通过分析逐段聚集平均(Piecewise Aggregate Approximation, PAA)表示方法,提炼出时间序列的时间特性,对于较近时间段的数据具有较高的参考价值,而较远时间段内的数据则具有较低的参考价值。改造PAA表示方法,得到逆向逐段聚集平均(Reversed Piecewise Aggregate Approximation, RPAA)表示方法,对不同的分段引入不同的影响因子,证明了基于RPAA方法的距离下界于Euclidean距离,保证在时间序列相似搜索中不会发生漏查。实验结果表明,RPAA较PAA在相似搜索中具有较小的错差率。将自适应逐段常量近似(Adaptive Piecewise Constant Approximation, APCA)表示方法扩展到动态时间序列的分段中,得到自适应逐段常量近似(Adaptive Piecewise Constant Approximation on Stream, APCAS)。APCAS能够在线性时间内完成在线时间序列流的分段,比APCA具有更少的内存消耗和更短的分段时间。 当前的动态时间序列弯曲距离(Dynamic Time Warping, DTW)下界函数,要么采用序列间的较少特征而与实际的DTW具有较大差异,要么不具备对称特性而限制了下界函数的应用范围。在分析DTW下界函数特性的基础上,给出了一种DTW下界函数LB_HUST,证明了LB_HUST具有对称性和下界性。将LB_HUST扩展到时间序列集合的距离计算中,证明了LB_HUST在时间序列集合计算中的性质。实验结果表明,LB_HUST不仅是时间序列基于DTW计算的一种紧密而对称的下界函数,而且在时间序列聚类中能够取得较好效果。 为改变当前时间序列流匹配中多是采用单一的相似比较手段的现状,给出一种支持多种比较方法的时间序列流匹配模型框架Multi-TSource,将比较方法和其他的时间序列流处理手段分离。在Multi-TSource的基础上,分别重点分析了基于Euclidean和DTW的比较方法,最后通过实验验证了Multi-TSource框架的可行性。结果表明,支持多种比较方法并不会使系统的效率有显著降低,通过分发机制可以使多种比较方法相互独立,为系统的动态扩展提供了保证。 为提高计算的效率,将提前终止技术引入到了DTW距离的计算中,在分析DTW提前终止性质的基础上,给出DTW提前终止算法EA_DTW,用实验验证了DTW提前终止算法的效率。EA_DTW方法可以跳过冗余的DTW方格计算,经常在不需要全部计算精确DTW距离的情形下即可完成序列的DTW相似比较,从而节省计算资源。 以前的提前终止技术的效率都是建立在实验验证的基础上,而缺乏理论化的工具,为此,设计了一种提前终止的效率估算方法EA_Estimate,通过对有效计算路径上溢出的估计,最终估算出最终的提前终止的效率。理论计算和实际的计算的实验对比结果表明,EA_Estimate可以确定一个大致的效率范围,帮助用户确定最终有效值。由于时间序列不具备显式的关键字,目前出现的基于关键字的排序方法不能直接应用于时间序列的排序。在对时间序列排序的问题进行定义的基础上,根据时间序列与序列集合边界的关系得出了基于时间序列边界的排序方法TS-Sort,并且在实现时实现了基于划分的改进方法,证明了改进方法与直接方法的等效性。最后通过实验对TS-Sort进行了验证。结果表明,TS-Sort不仅可以作为一项时间序列处理的工具,而且可能根据排序的结果对所处理的数据有深层次的认识。 以上述研究成果为基础,设计和实现了一个时间序列相似搜索的原型系统TimeSeriesSim1.0,为时间序列相似性问题提供了统一的实验平台和扩展依据。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘芬;郭躬德;;基于符号化聚合近似的时间序列相似性复合度量方法[J];计算机应用;2013年01期
2 尹洪胜;刘秀荣;钱建生;华钢;;时间序列相似性定义延拓[J];计算机工程与应用;2008年25期
3 王国仁;葛健;徐恒宇;郑若石;;基于二分频率变换的序列相似性查询处理技术[J];软件学报;2006年02期
4 蒋嵘;基于形态表示的时间序列相似性搜索[J];计算机研究与发展;2000年05期
5 吴绍春;吴耿锋;王炜;蔚赵春;;寻找地震相关地区的时间序列相似性匹配算法[J];软件学报;2006年02期
6 戴东波;熊赟;朱扬勇;;基于参考集索引的高效序列相似性查找算法[J];软件学报;2010年04期
7 魏莲;变换域时间序列相似性搜索[J];河北理工学院学报;2004年04期
8 朱天;白似雪;;基于模式距离度量的时间序列相似性搜索[J];微计算机信息;2007年30期
9 毛云建;杜秀华;;基于形态特征的时间序列相似性搜索算法[J];计算机仿真;2008年01期
10 刘培华;王立宏;;一种改进的事件序列相似性计算公式[J];计算机工程与应用;2009年07期
11 张玮昕;王耘波;高俊雄;;一种事件序列相似性评估方法[J];计算机与数字工程;2013年01期
12 杨敏,王志坚,尹燕敏;时间序列相似性搜索算法研究[J];山东师大学报(自然科学版);2001年04期
13 王露珊;刘兵;刘勇;;对时间序列相似性查询的最优小波误差估计[J];计算机应用;2007年03期
14 杜洪波;张颖;赵莹;;基于形态的时间序列子序列相似性研究[J];沈阳工程学院学报(自然科学版);2009年02期
15 曹丹阳;孙宁;马楠;刘永彬;;面向噪声数据的时间序列相似性搜索研究[J];计算机工程与设计;2012年09期
16 邱均平;王菲菲;;时间序列相似性查询与索引方法研究[J];山东图书馆学刊;2009年06期
17 梁建海;杜军;孙秀霞;李湘清;;一种复合高维时间序列相似性搜索方法[J];计算机工程;2006年10期
18 梁建海;张建业;杨峰;潘泉;;基于斜率偏离的时间序列相似性搜索方法研究[J];计算机应用研究;2010年01期
19 梁建海;杜军;冀捐灶;;多元飞行数据的时间序列相似性搜索方法[J];计算机工程;2007年03期
20 朱渊萍;;一种新的时间序列相似性模式发现算法[J];海南师范大学学报(自然科学版);2011年02期
中国重要会议论文全文数据库 前3条
1 卓明;王丽珍;谭旭;;基于时间序列相似性搜索的预测算法[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 邱均平;王菲菲;;时间序列相似性查询与索引方法研究[A];2009年中国索引学会年会暨学术研讨会论文集[C];2009年
3 李凤敏;李前忠;张俊萍;;基于离散增量和协变判别式识别小鼠蛋白质亚细胞定位[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
中国博士学位论文全文数据库 前1条
1 李俊奎;时间序列相似性问题研究[D];华中科技大学;2008年
中国硕士学位论文全文数据库 前10条
1 左芳;十二株放线菌系统发育的研究[D];河北大学;2007年
2 孙宏伟;基于DTW距离的时间序列相似性查询和shapelets分类算法研究[D];太原理工大学;2016年
3 李娟;生物序列相似性搜索算法研究与实现[D];华南理工大学;2016年
4 涂俐兰;基于快速沃尔什变换的生物序列相似性比对[D];华中科技大学;2004年
5 陈伟;生物信息学中的序列相似性比对算法[D];中国海洋大学;2006年
6 李明亮;时间序列相似性聚类算法研究[D];湖南大学;2010年
7 王克龙;离散小波变换分析蛋白质序列相似性[D];四川大学;2004年
8 刘芳;基于信息离散度的DNA序列相似性分析研究[D];湖南大学;2009年
9 孙达辰;基于DTW的时间序列相似性搜索的研究[D];大庆石油学院;2010年
10 杜洪波;时间序列相似性查询及异常检测算法的研究[D];沈阳工业大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978