收藏本站
《兰州理工大学》 2016年
加入收藏

基于形态特征的时间序列相似性搜索研究

安云杰  
【摘要】:如今,我们生活在一个复杂多变的数据时代,这些数据正源源不断地产生于各个领域,并潜移默化的改变着我们的生活节奏和生活方式。在这些数据中,能够给人们的生活带来巨大影响的时间序列是一类重要的数据,所以对其的分析变得十分重要。但由于高维和杂乱等因素的影响使得对时间序列的研究变得十分困难,为了找出序列中隐含的重要信息,研究人员开始运用数据挖掘的手段对时间序列进行探索研究。在时间序列数据挖掘算法中,时间序列相似性搜索占有重要地位,吸引了大多数学者的深入研究。随着时间的推移,时间序列相似性搜索研究的方法和成果普遍应用于人们日常生活中的各个领域,譬如:证券的投资与决策、地震勘探与预测、医疗保险等。在时间序列相似性搜索中,形态特征反映时间序列的主要特性,既能客观的反映出序列的全部变化趋势,又可以体现出细节变化特点。同时,基于形态特征的距离度量算法能够很好地计算出序列间的形态差别,对时间序列相似性搜索技术的研究具有深远影响。经过阅读和专研大量海内外关于时间序列形态特征范畴内的相关文献,本文全面细致地概况了基于形态特征的时间序列相似性搜索算法的近况,并对其发展阶段中的各个经典算法进行了详细的描述和分析,指出所存在问题,在此基础上提出了相应的解决方法,本文主要研究工作包括:(1)将算术编码技术应用到时间序列相似性搜索中,此方法首先运用关键点分段技术提取时间序列的均值和斜率等序列的特征信息,采取数字符号化方法得到能充分体现序列均值和斜率信息的符号序列;然后通过编码技术将符号序列转化为编码序列,实现时间序列在概率区间上的模式表示;最后采用分层欧式距离算法进行相似性搜索,由粗到细进行筛选,从而达到序列整体趋势匹配以及细节拟合的目标。(2)提出基于符号聚合近似(Symbolic Aggregate approximation,SAX)和角点弯曲值的复合搜索算法。该方法将时间序列进行角点分段并提取序列的角点弯曲度值和均值信息,利用二者组成二元组的形式对时间序列进行复合表示;在此基础上,采用具有较高质量的复合距离算法在时间序列集中进行相似性搜索,得到的结果集可以达到数值和形态两方面都相似的目的。
【关键词】:时间序列 相似性搜索 形态特征 统计特征
【学位授予单位】:兰州理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;O211.61
【目录】:
  • 摘要7-8
  • Abstract8-12
  • 第1章 绪论12-25
  • 1.1 课题研究背景与意义12-14
  • 1.2 国内外研究现状14-23
  • 1.2.1 时间序列数据挖掘的研究现状14-17
  • 1.2.2 基于形态特征的时间序列相似性搜索的现状分析17-22
  • 1.2.3 存在的问题22-23
  • 1.3 本文主要工作23
  • 1.4 本文内容安排23-25
  • 第2章 基于形态特征的时间序列相似性搜索相关技术及算法25-36
  • 2.1 引言25
  • 2.2 基于形态特征的时间序列模式表示25-30
  • 2.2.1 模式表示的概述25-26
  • 2.2.2 形态特征模式表示的主要方法26-30
  • 2.3 基于形态特征的时间序列相似性度量30-35
  • 2.3.1 Minkowski距离31-32
  • 2.3.2 动态时间弯曲32-34
  • 2.3.3 模式距离34-35
  • 2.3.4 复合距离35
  • 2.4 本章小结35-36
  • 第3章 算术编码技术在时间序列分层搜索上的应用36-45
  • 3.1 引言36
  • 3.2 相关理论及数据预处理36-38
  • 3.2.1 数据规范化36-37
  • 3.2.2 关键点分段与对等37-38
  • 3.3 时间序列符号化与算术编码算法38-42
  • 3.3.1 均值和斜率符号化38
  • 3.3.2 编码38-40
  • 3.3.3 相似性度量40-42
  • 3.4 实验仿真42-44
  • 3.4.1 实验数据42
  • 3.4.2 相似性度量的比较42-44
  • 3.5 结论44-45
  • 第4章 基于角点弯曲度和均值的时间序列相似性匹配算法45-53
  • 4.1 引言45
  • 4.2 时间序列模式表示45-48
  • 4.2.1 角点分段与对等46-47
  • 4.2.2 符号化与角点表示47-48
  • 4.2.3 复合表示48
  • 4.3 相似性距离计算48-49
  • 4.3.1 符号化距离和角点弯曲度距离48-49
  • 4.3.2 复合距离49
  • 4.4 实验仿真49-52
  • 4.4.1 实验环境与实验数据49-50
  • 4.4.2 实验与分析50-52
  • 4.5 结论52-53
  • 结论与展望53-55
  • 参考文献55-59
  • 致谢59-60
  • 附录A 攻读学位期间所发表的学术论文60

【参考文献】
中国期刊全文数据库 前10条
1 孙雅;李志华;;基于区域极值点的时间序列聚类算法[J];计算机工程;2015年05期
2 原继东;王志海;;时间序列的表示与分类算法综述[J];计算机科学;2015年03期
3 包伟伟;夏士雄;牛强;;基于三角不等式的时间序列相似性搜索算法[J];计算机工程与设计;2014年12期
4 袁铭;;标度曲线拟合与金融时间序列聚类[J];计算机应用;2014年11期
5 余宇峰;朱跃龙;万定生;关兴中;;基于滑动窗口预测的水文时间序列异常检测[J];计算机应用;2014年08期
6 肖瑞;刘国华;;基于趋势的时间序列相似性度量和聚类研究[J];计算机应用研究;2014年09期
7 张海涛;李志华;孙雅;张华伟;;新的时间序列相似性度量方法[J];计算机工程与设计;2014年04期
8 吴虎胜;张凤鸣;钟斌;;基于二维奇异值分解的多元时间序列相似匹配方法[J];电子与信息学报;2014年04期
9 肖瑞;刘国华;宋转;刘玉静;;不确定时间序列的编码匹配[J];计算机与数字工程;2013年11期
10 弓晋丽;彭贤武;;交通流时间序列模式相似性度量法[J];计算机工程与应用;2015年06期
中国博士学位论文全文数据库 前2条
1 申彦;大规模数据集高效数据挖掘算法研究[D];江苏大学;2013年
2 李桂玲;时间序列的分割及不一致发现研究[D];华中科技大学;2012年
中国硕士学位论文全文数据库 前1条
1 郭龙;时间序列数据的周期性研究[D];电子科技大学;2013年
【共引文献】
中国期刊全文数据库 前10条
1 邵开霞;陈淡泊;周晓峰;;基于改进的K-means聚类方法的多站数据关联异常检测[J];微型电脑应用;2016年11期
2 常耀辉;;基于时间序列和资源相似性的云资源优化模型[J];信息通信;2016年10期
3 赵忠明;孟瑜;岳安志;黄青青;孔赟珑;袁媛;刘晓奕;林蕾;张蒙蒙;;遥感时间序列影像变化检测研究进展[J];遥感学报;2016年05期
4 王燕;安云杰;;时间序列相似性度量方法[J];计算机工程与设计;2016年09期
5 杨慧;王光霞;;基于重要点的飞机发动机数据异常子序列检测[J];计算机工程与设计;2016年09期
6 周晓园;余旌胡;;基于平稳子空间分析和相对熵的分类算法[J];河南科技大学学报(自然科学版);2016年06期
7 马超红;翁小清;;时间序列早期分类综述[J];微型机与应用;2016年16期
8 丁剑;王树英;;一种使用shapelets的增量式时间序列分类[J];计算机科学;2016年05期
9 李中;刘洋洋;张铁峰;;基于形态相似距离的时间序列相似度计算[J];计算机工程与设计;2016年03期
10 丁雨晴;隋爱娜;伏文龙;王亚光;;基于免疫算法的时间序列预测模型[J];中国传媒大学学报(自然科学版);2016年01期
中国博士学位论文全文数据库 前4条
1 范广玲;基于数据挖掘的潜油电泵系统运行评价研究[D];东北石油大学;2015年
2 张新娟;基于知识挖掘的工程管理人才生涯决策方法及管理研究[D];华北电力大学;2015年
3 刘健;基于协同进化理论的图书馆知识生态化机理与技术实现研究[D];吉林大学;2015年
4 赵华;基于粗糙集理论的混合数据挖掘方法研究[D];西南交通大学;2014年
中国硕士学位论文全文数据库 前5条
1 安云杰;基于形态特征的时间序列相似性搜索研究[D];兰州理工大学;2016年
2 包仁义;基于时间序列的搜索引擎评估模型算法研究[D];东北师范大学;2015年
3 郑晓辉;山东省工矿商贸企业生产安全事故致因模型及其发生规律研究[D];中国地质大学(北京);2015年
4 洪淑慧;近似周期时间序列的周期识别及提取[D];华东师范大学;2015年
5 赵建秀;时间序列的相似性分析问题研究[D];山东师范大学;2014年
【二级参考文献】
中国期刊全文数据库 前10条
1 李奇泽;张铁刚;丁焕强;;中国证券投资基金羊群行为——基于周期规律与板块效应的实证分析[J];中央财经大学学报;2013年06期
2 黄健柏;程慧;郭尧琦;邵留国;;金属期货量价关系的多重分形特征研究——基于MF-DCCA方法[J];管理评论;2013年04期
3 倪志伟;胡汤磊;吴晓璇;张庆荣;;基于分形理论的一种新的机器学习方法:分形学习[J];中国科学技术大学学报;2013年04期
4 谭宏强;牛强;;基于滑动窗口及局部特征的时间序列符号化方法[J];计算机应用研究;2013年03期
5 张林;刘春燕;;日中两国不同经济时期股市的多重分形分析[J];系统工程理论与实践;2013年02期
6 李志刚;牛强;;一种改进的符号化时间序列聚类方法[J];微电子学与计算机;2012年11期
7 谢福鼎;李迎;孙岩;张永;;改进的符号化时间序列处理方法[J];计算机工程与设计;2012年10期
8 刘博宁;张建业;张鹏;王占磊;;基于曲率距离的时间序列相似性搜索方法[J];电子与信息学报;2012年09期
9 尹令;洪添胜;刘汉兴;刘财兴;王永波;;结构相似子序列快速聚类算法及其在奶牛发情检测中的应用[J];农业工程学报;2012年15期
10 周瑜;刘俊涛;白翔;;形状匹配方法研究与展望[J];自动化学报;2012年06期
中国博士学位论文全文数据库 前2条
1 闫秋艳;煤矿概率流数据挖掘方法研究[D];中国矿业大学;2010年
2 肖辉;时间序列的相似性查询与异常检测[D];复旦大学;2005年
中国硕士学位论文全文数据库 前3条
1 李素珍;基于卷积算法的时间序列部分周期模式挖掘算法研究[D];天津大学;2010年
2 肖志国;几种水文时间序列周期分析方法的比较研究[D];河海大学;2006年
3 赵海青;动态时间序列周期分析预测模型[D];郑州大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 彭敏;方慧生;;酶功能分类与序列相似性研究进展[J];国外医学.药学分册;2006年06期
2 杜云龙;;基于时间序列的数据相似性统计[J];内蒙古电大学刊;2007年06期
3 杨敏,王志坚,尹燕敏;时间序列相似性搜索算法研究[J];山东师大学报(自然科学版);2001年04期
4 朱渊萍;;一种新的时间序列相似性模式发现算法[J];海南师范大学学报(自然科学版);2011年02期
5 李峰;;关于时间序列相似性问题中间隔因子讨论[J];科技信息(科学教研);2007年14期
6 于海龙;肖云;艾静;李霞;宫滨生;;毒蕈乙酰胆碱受体亚型关系的研究[J];遗传;2007年10期
7 周勇;林旬;;时间序列相似性的图形相似方法研究[J];统计与决策;2007年10期
8 郑华;李炜;邱剑锋;林晨;蒋阿芳;;基于时间序列相似性匹配算法的研究[J];井冈山大学学报(自然科学版);2010年03期
9 滕传远,吴绍熙;热变性法测定红色毛癣菌核中DNA鸟嘌呤加胞嘧啶含量的研究[J];中国医学科学院学报;1989年04期
10 李梅;白凤兰;;基于DTW距离的DNA序列相似性分析[J];生物数学学报;2009年02期
中国重要会议论文全文数据库 前3条
1 卓明;王丽珍;谭旭;;基于时间序列相似性搜索的预测算法[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 邱均平;王菲菲;;时间序列相似性查询与索引方法研究[A];2009年中国索引学会年会暨学术研讨会论文集[C];2009年
3 李凤敏;李前忠;张俊萍;;基于离散增量和协变判别式识别小鼠蛋白质亚细胞定位[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
中国博士学位论文全文数据库 前1条
1 李俊奎;时间序列相似性问题研究[D];华中科技大学;2008年
中国硕士学位论文全文数据库 前10条
1 孙宏伟;基于DTW距离的时间序列相似性查询和shapelets分类算法研究[D];太原理工大学;2016年
2 李娟;生物序列相似性搜索算法研究与实现[D];华南理工大学;2016年
3 涂俐兰;基于快速沃尔什变换的生物序列相似性比对[D];华中科技大学;2004年
4 陈伟;生物信息学中的序列相似性比对算法[D];中国海洋大学;2006年
5 李明亮;时间序列相似性聚类算法研究[D];湖南大学;2010年
6 王克龙;离散小波变换分析蛋白质序列相似性[D];四川大学;2004年
7 刘芳;基于信息离散度的DNA序列相似性分析研究[D];湖南大学;2009年
8 孙达辰;基于DTW的时间序列相似性搜索的研究[D];大庆石油学院;2010年
9 左芳;十二株放线菌系统发育的研究[D];河北大学;2007年
10 杜洪波;时间序列相似性查询及异常检测算法的研究[D];沈阳工业大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026