收藏本站
《天津大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

时间序列数据挖掘相似性度量和周期模式挖掘研究

董晓莉  
【摘要】: 随着信息技术的飞速发展,数据挖掘受到越来越多的关注。时序数据在现实生活中广泛存在,如金融市场、工业过程、科学试验、医疗、气象、水文、生物信息等,而且存储规模呈现爆炸式增长。因此对时间序列数据挖掘问题进行深入研究是非常必要和富有挑战性的。目前的时间序列数据挖掘技术尚处于起步阶段,挖掘算法有待扩充和完善。 本文在综述了时间序列数据挖掘研究发展概况后,对目前的主要方法进行了总结评述,在重新描述、相似性比较和周期模式挖掘几个方面进行了深入研究。最后在总结全文的基础上,指出了本文有待深入研究的若干问题。本文的创新性工作主要包括以下内容: 1)提出了基于形态的时间序列相似性度量方法。本方法在时间序列分段线性化的基础上,采用了基于斜率相对变化的符号化重新描述方法,可以有效描述序列形态的动态变化趋势;同时提出了一个与之对应的距离度量公式,克服了点距离度量中存在的对各种扰动敏感的缺陷。实验证明,本方法还具有时间多分辨率特征,可以比较在不同时间分辨率下的时间序列的相似程度。 2)提出了局部分段动态时间扭曲算法。经典动态时间扭曲算法(DTW)在时间序列相似性度量中具有重要作用,但由于计算复杂度较高,很难应用于实际数据库中。本文提出了一个新的算法——局部分段动态时间扭曲算法。在对时间序列进行分段线性化的基础上,将每一个段视为一个整体,应用经典的动态时间扭曲算法,通过设置补偿系数,保证了算法的精度。实验表明,本算法能够在计算精度几乎没有损失的情况下,有效地提高经典DTW算法的效率。 3)提出了一种高效的时间序列异步周期1-模式挖掘算法。本算法设计了一种基于2进制编码的映射算法,并提出了改进的点乘算法,可以通过一次计算发现一个事件在序列中出现的所有位置;并且,本算法用并行计算替代了原算法中的串行计算方法,显著减少了数据的运算和存储次数。实验证明,本算法在完全不降低原算法准确性的基础上,显著提高了算法效率。 4)首次提出了时间序列局部周期频繁模式的概念及其挖掘算法。不同于现有的所有周期挖掘算法,本算法不但能够挖掘出贯穿时间序列全局的频繁发生的周期模式,而且能够发现只在某个局部频繁发生的周期模式。本算法首先将时间序列划分为局部集合,然后基于数据自行找出序列中隐藏的潜在周期,生成局部周期频繁1-模式,最后在每一个有交叉的局部上,应用最大命中子模式树算法合成复杂模式输出。实验证明,本算法可以有效地发现时间序列中的局部周期频繁模式,其中的剪切算法和周期阈值公式能够有效提高算法效率。
【学位授予单位】:天津大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:O211.61

【引证文献】
中国博士学位论文全文数据库 前7条
1 朱进;基于运动特征的轨迹相似性度量研究[D];南京师范大学;2015年
2 张静;天气影响的机场容量与延误评估研究[D];南京航空航天大学;2012年
3 吴佳文;水文时间序列数据挖掘算法研究与应用[D];沈阳农业大学;2011年
4 黄静华;支持向量机算法研究及在气象数据挖掘中的应用[D];中国矿业大学(北京);2011年
5 尹洪胜;煤矿瓦斯时间序列分析方法与预警应用研究[D];中国矿业大学;2010年
6 程文聪;面向大规模网络安全态势分析的时序数据挖掘关键技术研究[D];国防科学技术大学;2010年
7 李大路;基于WAMS/SCADA混合量测的电力系统状态估计研究[D];武汉大学;2009年
【参考文献】
中国期刊全文数据库 前6条
1 潘定;沈钧毅;;时态数据挖掘的相似性发现技术[J];软件学报;2007年02期
2 刘世元,江浩;面向相似性搜索的时间序列表示方法述评[J];计算机工程与应用;2004年27期
3 王达,荣冈;时间序列的模式距离[J];浙江大学学报(工学版);2004年07期
4 靳晓明,陆玉昌,石纯一;时序规则分布挖掘方法[J];清华大学学报(自然科学版);2003年07期
5 姜宁,史忠植;文本聚类中的贝叶斯后验模型选择方法[J];计算机研究与发展;2002年05期
6 李斌,谭立湘,解光军,李海鹰,庄镇泉;非同步多时间序列中频繁模式的发现算法[J];软件学报;2002年03期
中国博士学位论文全文数据库 前1条
1 肖辉;时间序列的相似性查询与异常检测[D];复旦大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 谢坤武;;文本挖掘中的层次聚类算法[J];湖北民族学院学报(自然科学版);2009年04期
2 吴枫;仲妍;吴泉源;贾焰;杨树强;;基于适应性分段估计的数据流相似性搜索[J];软件学报;2009年10期
3 朱鹤;赵威;余靖;金顺福;刘国华;;排序的子序列相似查询方法[J];燕山大学学报;2009年05期
4 刘威;邵良杉;曾繁慧;王江;付巍巍;;基于SAX方法的股票时间序列数据相似性度量方法研究[J];计算机工程与科学;2009年09期
5 陈卓;杨炳儒;周法国;李琳娜;;基于时态逻辑的多时间序列挖掘模型[J];辽宁工程技术大学学报(自然科学版);2009年04期
6 梁建海;张建业;杨峰;潘泉;;时间序列度量的斜率偏离距离方法研究[J];计算机工程与应用;2009年22期
7 罗航;黄建国;龙兵;王厚军;;基于相关系数方法的样本失效分布研究[J];系统工程与电子技术;2009年07期
8 杜洪波;张颖;赵莹;;基于形态的时间序列子序列相似性研究[J];沈阳工程学院学报(自然科学版);2009年02期
9 李士进;朱跃龙;张晓花;万定生;;基于BORDA计数法的多元水文时间序列相似性分析[J];水利学报;2009年03期
10 况夯;罗军;;基于遗传FCM算法的文本聚类[J];计算机应用;2009年02期
中国博士学位论文全文数据库 前10条
1 王蕾;网络舆情信息与现实交易行为的映射关系研究与应用[D];上海大学;2016年
2 蔡超;大型发电机多数字源快速差动保护关键技术的研究[D];东南大学;2016年
3 尚华;两类时间序列模型的异常值检测研究[D];首都经济贸易大学;2016年
4 高湘昀;经济时间序列中传导动力学特性研究[D];中国地质大学(北京);2015年
5 张勇;时间序列模式匹配技术研究[D];华中科技大学;2012年
6 于霄;基于间隔理论的序列数据挖掘研究[D];哈尔滨工业大学;2012年
7 张沁川;波形映射技术及其在数字存储示波器中的应用研究[D];电子科技大学;2012年
8 李桂玲;时间序列的分割及不一致发现研究[D];华中科技大学;2012年
9 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年
10 闫秋艳;煤矿概率流数据挖掘方法研究[D];中国矿业大学;2010年
【同被引文献】
中国博士学位论文全文数据库 前10条
1 袁晶;大规模轨迹数据的检索、挖掘和应用[D];中国科学技术大学;2012年
2 袁冠;移动对象轨迹数据挖掘方法研究[D];中国矿业大学;2012年
3 张治华;基于GPS轨迹的出行信息提取研究[D];华东师范大学;2010年
4 李和成;非线性双层规划问题的遗传算法研究[D];西安电子科技大学;2009年
5 陈晓刚;电网广域安全监测系统若干关键技术问题研究[D];浙江大学;2008年
6 刘密霞;网络安全态势分析与可生存性评估研究[D];兰州理工大学;2008年
7 李丽娟;最小二乘支持向量机建模及预测控制算法研究[D];浙江大学;2008年
8 苏亮;数据流分析关键技术研究[D];国防科学技术大学;2008年
9 段华;支持向量机的增量学习算法研究[D];上海交通大学;2008年
10 宣蕾;网络安全定量风险评估及预测技术研究[D];国防科学技术大学;2007年
【二级引证文献】
中国博士学位论文全文数据库 前6条
1 胡满江;基于车载机器视觉的安全带识别方法研究[D];江苏大学;2014年
2 李善梅;空中交通拥挤的识别与预测方法研究[D];天津大学;2014年
3 赵志凯;半监督学习及其在煤矿瓦斯安全信息处理中的应用研究[D];中国矿业大学;2012年
4 陈世海;冲击地压电磁辐射前兆信息识别技术研究[D];中国矿业大学;2012年
5 柴艳莉;基于智能信息处理的煤与瓦斯突出的预警预测研究[D];中国矿业大学;2011年
6 周磊;基于注意机制的煤矿监控图像知觉编组研究[D];中国矿业大学;2010年
【二级参考文献】
中国期刊全文数据库 前1条
1 李斌,谭立湘,章劲松,庄镇泉;面向数据挖掘的时间序列符号化方法研究[J];电路与系统学报;2000年02期
【相似文献】
中国期刊全文数据库 前10条
1 施久玉,杜金观;有限个状态时间序列的某些结果[J];应用数学学报;1990年01期
2 冯希杰;长江三峡及其邻区断裂活动时间序列[J];华南地震;1991年02期
3 王霞,郭嗣琮,刘淑娟;时间序列模糊滑动预测[J];辽宁工程技术大学学报(自然科学版);1999年03期
4 温品人;时间序列预测法的实际应用分析[J];江苏广播电视大学学报;2001年06期
5 许清海;混沌投资时间序列的嬗变[J];漳州师范学院学报(自然科学版);2003年01期
6 程毛林;时间序列系统建模预测的一种新方法[J];数学的实践与认识;2004年08期
7 高洁;长记忆时间序列适应性预测的应用[J];江南大学学报;2004年05期
8 高洁;孙立新;;长记忆时间序列的适应性预测误差的谱密度[J];统计与决策;2006年13期
9 杨钟瑾;;浅谈时间序列的分析预测[J];中国科技信息;2006年14期
10 李健;孙广中;许胤龙;;基于时间序列的预测模型应用与异常检测[J];计算机辅助工程;2006年02期
中国重要会议论文全文数据库 前10条
1 周家斌;张海福;杨桂英;;多维多步时间序列预报方法及其应用[A];中国现场统计研究会第九届学术年会论文集[C];1999年
2 马培蓓;纪军;;基于时间序列的航空备件消耗预测[A];中国系统工程学会决策科学专业委员会第六届学术年会论文集[C];2005年
3 卢世坤;李夕海;牛超;陈蛟;;时间序列的非线性非平稳特性研究综述[A];国家安全地球物理丛书(八)——遥感地球物理与国家安全[C];2012年
4 李强;;基于线性模型方法对时间序列中异常值的检测及证券实证分析[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(上册)[C];2002年
5 戴丽金;何振峰;;基于云模型的时间序列相似性度量方法[A];第八届中国不确定系统年会论文集[C];2010年
6 谢美萍;赵希人;庄秀龙;;多维非线性时间序列的投影寻踪学习逼近[A];'99系统仿真技术及其应用学术交流会论文集[C];1999年
7 张大斌;李红燕;刘肖;张文生;;非线性时问序列的小波-模糊神经网络集成预测方法[A];第十五届中国管理科学学术年会论文集(下)[C];2013年
8 黄云贵;;基于时间序列的电网固定资产投资规模研究[A];2012年云南电力技术论坛论文集(文摘部分)[C];2012年
9 李松臣;张世英;;时间序列高阶矩持续和协同持续性研究[A];21世纪数量经济学(第8卷)[C];2007年
10 陈赫;罗声求;;历史横断面数据的时间序列化[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年
中国重要报纸全文数据库 前6条
1 ;《时间序列与金融数据分析》[N];中国信息报;2004年
2 何德旭 王朝阳;时间序列计量经济学:协整与有条件的异方差自回归[N];中国社会科学院院报;2003年
3 刘俏;让数据坦白真相[N];21世纪经济报道;2003年
4 西南证券高级研究员 董先安德圣基金研究中心 郭奔宇;预计6月CPI同比上涨7.2%[N];证券时报;2008年
5 东证期货 王爱华 杨卫东;两年涨跌轮回 秋季普遍下跌[N];期货日报;2009年
6 任勇郑重;中国对世界钢材价格的影响实证分析[N];现代物流报;2007年
中国博士学位论文全文数据库 前10条
1 张墨谦;遥感时间序列数据的特征挖掘:在生态学中的应用[D];复旦大学;2014年
2 张德成;滑坡预测预报研究[D];昆明理工大学;2015年
3 苗圣法;时间序列的模式检测[D];兰州大学;2015年
4 翁同峰;时间序列与复杂网络之间等价性问题及表征应用研究[D];哈尔滨工业大学;2015年
5 杨婷婷;用Argo浮标结合卫星观测估算北太平洋经向热输运[D];中国科学院研究生院(海洋研究所);2015年
6 史文彬;时间序列的相关性及信息熵分析[D];北京交通大学;2016年
7 原继东;时间序列分类算法研究[D];北京交通大学;2016年
8 卢伟;基于粒计算的时间序列分析与建模方法研究[D];大连理工大学;2015年
9 王晓晔;时间序列数据挖掘中相似性和趋势预测的研究[D];天津大学;2003年
10 李桂玲;时间序列的分割及不一致发现研究[D];华中科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 陈健;基于多变量相空间重构的投资组合策略研究[D];华南理工大学;2015年
2 兰鑫;时间序列的复杂网络转换策略研究[D];西南大学;2015年
3 米晓将;区域尺度下月均气温的时空演化格局研究[D];昆明理工大学;2015年
4 张鸣敏;基于支持向量回归的PM_(2.5)浓度预测研究[D];南京信息工程大学;2015年
5 林健;基于改进小世界回声状态网的时间序列预测[D];渤海大学;2015年
6 曹智丽;日气温和干旱指数支持向量回归预测方法[D];南京信息工程大学;2015年
7 高雄飞;基于分形理论的土壤含水量时间序列特性分析[D];长安大学;2015年
8 姚茜;城市安全生产发展目标研究[D];中国地质大学(北京);2015年
9 谢翠颖;苏州社会消费品零售总额简析[D];苏州大学;2015年
10 包仁义;基于时间序列的搜索引擎评估模型算法研究[D];东北师范大学;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026