收藏本站
《复旦大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

时间序列挖掘与相似性查找技术研究

曾海泉  
【摘要】: 时间序列(Time Series)是一种重要的数据对象,在现实世界许多领域中都广泛存在,如股票价格,商品销售数据,气象数据等等。随着时间推移,这类数据的存储规模呈现爆炸式地增长。因此,对这些海量的时序数据如何进行有效的知识发现,挖掘其内在的各种变化模式:对于用户给定具有各种抽象含义的变化模式,如何在海量时间序列库中进行相似性的检索等应用分析,这是一个挑战性的、具有重要意义的理论和实际应用课题。该课题的研究对于我们正确认识事物变化,科学进行决策,识别各种异常行为等具有重要的指导意义。 本文在分析时间序列特点和实际应用需求的基础上,针对时间序列的挖掘与相似性查找一些关键技术进行了研究,具体包括特征模式挖掘、多序列关联模式挖掘、相似性模式查找,在线相似性查找以及最终的分析应用系统开发等方面,所做的工作和取得的创新成果体现在以下五个方面: 1)时间序列特征模式挖掘研究 首次提出了一种基于互关联后继树模型的时序特征模式挖掘方法。不同于传统处理模式,该方法在序列分段上,采用了一种新颖的、基于重要点的时间序列线段化算法;在符号化过程中,采用基于相对斜率的局部符号化方法。既减少计算复杂度,又避免了噪声的影响。在挖掘算法实现上,根据序列特征模式的有序性和重复性,提出了一种无须生成大量的候选模式集的互关联后继树挖掘算法。算法挖掘的结果不仅是一种图形化的描述,而且还具有明确的实际含义,大大有利于在实际中的应用。实验结果表明,与传统的方法相比,该算法极大地提高了挖掘效率。 2)多时间序列间关联模式挖掘研究 针对更有分析价值的多序列关联模式,进一步提出一种新颖的关联模式挖掘方法。该方法利用Allen区间逻辑关系来描述时间序列模式的关联关系,避免了传统方法在关联关系描述上的非同步性;然后通过时间观测窗口,构造出—种包含并行模式和串行模式特殊形式的模式序列;最后,在此基础上构造一种广义的互关联后继树模型,然后用前面挖掘思路实现关联模式的挖掘。实验结果显示,该新方法比传统的Apriori算法具有更好的挖掘效率和挖掘效果。 3)时间序列相似性查找研究 为了在实际分析中对挖掘结果的运用,本文还研究了时间序列的相似性查 摘要 找。在分析比较了根据时间序列与全文序列的异同后,采用了全文索引技术,首 次提出了一种基于互关联后继树的时间序列相似性查找方法。该方法提出通过基 于重要点分段技术的分段动态挖掘距离作为相似性度量,既保证了度量的鲁棒 性,又减少计算复杂度;利用各个分段的抽取六个主要特征,将时间序列转化成 一种特定的符号序列,在此基础上利用海量全文索引结构实现了相似性的索引查 找。在理论上证明了该方法不仅保证索引查找结果不会出现任何错误的遗漏,而 且在实验结果上也显示该方法比传统的方法具有明显的优势。 4)动态时间序列在线模式的相似性查找研究 针对时间序列实时分析的需要,给出了一种动态序列的在线相似性查找算 法。该算法利用改进的欧氏距离作为模式的相似度量方式,然后利用快速傅立叶 变换,实现动态序列与各指定模式的批处理相似性计算。为了缩短在批处理的等 待时间,再利用预测模型对未来的值进行预测,通过比较预测序列与特定模式之 间的相似性,来实现在线查找的快速响应。模拟实验结果显示,该算法在一定程 度上解决了在线查找的准确性与时效性。 5)时间序列分析系统框架研究和原型系统开发 提出了一个集成、开放的时间序列分析系统框架。该框架模型采用功能模 块化的方式集成,提供各种接日,具有较强的开放性;提供了时间挖掘与相似性 查找,在线检测等综合高层服务功能。最后在此基础上,还开发了一个证券时间 序列分析的原型系统。该系统提供了对股票价格指标等数据进行模式挖掘,图形 化条件选股,实时交易预警等功能,具有一定的实用价值。
【学位授予单位】:复旦大学
【学位级别】:博士
【学位授予年份】:2003
【分类号】:TP311.13

手机知网App
【引证文献】
中国期刊全文数据库 前7条
1 黄超;龚惠群;;金融领域时间序列挖掘技术研究[J];东南大学学报(哲学社会科学版);2007年05期
2 肖辉,胡运发;基于分段时间弯曲距离的时间序列挖掘[J];计算机研究与发展;2005年01期
3 魏莲;吴信才;;动态规划字符串匹配算法在曲线对比中的应用[J];计算机工程与应用;2007年08期
4 甄立冬;;高密度电子电路频谱对比方法[J];计算机与网络;2012年14期
5 潘定;沈钧毅;;时态数据挖掘的相似性发现技术[J];软件学报;2007年02期
6 秦少辉;肖辉;胡运发;;互关联后继树在时间序列特征模式挖掘中的应用[J];计算机工程与设计;2006年08期
7 汤俊;熊前兴;;基于时间序列相似度的离群模式检测模型[J];武汉大学学报(工学版);2006年03期
中国博士学位论文全文数据库 前4条
1 柴艳莉;基于智能信息处理的煤与瓦斯突出的预警预测研究[D];中国矿业大学;2011年
2 曲吉林;时间序列挖掘中索引与查询技术的研究[D];天津大学;2006年
3 李星毅;基于相似性的交通流分析方法[D];北京交通大学;2010年
4 姜向荣;短时间序列预测建模及应用研究[D];北京邮电大学;2009年
中国硕士学位论文全文数据库 前10条
1 吕海霞;基于DTW的相似度查询在完井深度计算中的应用[D];东北石油大学;2011年
2 左彦飞;不确定时间序列的相似性匹配问题研究[D];东华大学;2012年
3 凌广杰;基于分段半马尔可夫模型的在线序列模式检测方法研究[D];浙江大学;2006年
4 吕攀;联机分析挖掘(OLAM)在政府统计工作中的应用研究[D];上海师范大学;2006年
5 朱伟红;时间序列的趋势分析及在外汇交易中的应用[D];大连交通大学;2007年
6 郑继萍;时间序列的相似性挖掘及其在股票时间序列中的应用[D];东北财经大学;2007年
7 林香;证券分析中数据挖掘模型的研究及应用[D];厦门大学;2007年
8 刘昆;针对时间序列数据的时态关联规则挖掘研究[D];云南师范大学;2008年
9 王仲旭;基于电磁扫描的高密度电路模块检测技术研究[D];西安电子科技大学;2011年
10 吴红花;不确定性时间序列相似匹配过程中的关键问题研究[D];东华大学;2013年
【参考文献】
中国期刊全文数据库 前7条
1 李斌,谭立湘,章劲松,庄镇泉;面向数据挖掘的时间序列符号化方法研究[J];电路与系统学报;2000年02期
2 曾海泉,宋扬,刘永丹,胡运发;一个基于Rough集的用户兴趣访问模式的发现算法[J];计算机研究与发展;2002年12期
3 曾海泉,刘永丹,宋扬,胡运发;基于互关联后继树的多时间序列关联模式挖掘[J];计算机研究与发展;2003年07期
4 曾海泉,宋扬,申展,胡运发;基于互关联后继树的时间序列相似性查询[J];计算机研究与发展;2004年02期
5 尹旭日,商琳,何佳洲,陈世福;Rough集挖掘时间序列的研究[J];南京大学学报(自然科学版);2001年02期
6 李斌,谭立湘,解光军,李海鹰,庄镇泉;非同步多时间序列中频繁模式的发现算法[J];软件学报;2002年03期
7 马志锋,邢汉承,郑晓妹;一种基于Rough集的时间序列数据挖掘策略[J];系统工程理论与实践;2001年12期
【共引文献】
中国期刊全文数据库 前10条
1 裴丽鹊;;一种基于分段线性的FKD时间序列模式表示[J];赤峰学院学报(自然科学版);2008年07期
2 辛旭明,孙福良;基于故障诊断的数据挖掘系统[J];东华大学学报(自然科学版);2004年06期
3 李斌,汪祖媛,高清维,庄镇泉;基于遗传算法的时间序列中频繁结构模式发现研究[J];电路与系统学报;2004年04期
4 张宏刚,蒋传文,王承民,侯志俭;基于气象因素粗糙集理论的负荷预测方法[J];电力系统及其自动化学报;2004年04期
5 刘延卿;曹家琏;;粗集挖掘策略在时间序列分析系统中的应用[J];电脑知识与技术;2009年05期
6 李斌,谭立湘,邹谊,庄镇泉;量子概率编码遗传算法及其应用[J];电子与信息学报;2005年05期
7 陈卓;杨炳儒;周法国;李琳娜;;基于时态逻辑的多时间序列挖掘模型[J];辽宁工程技术大学学报(自然科学版);2009年04期
8 王清印,郭立田,谢建华,刘志勇;广义不确定性系统理论的基本构思[J];中国工程科学;2004年03期
9 王清印;吕瑞华;;广义不确定性系统理论的外延综论[J];中国工程科学;2005年10期
10 蒋增荣,成礼智;N=2~t点DFT的快速卷积算法[J];高等学校计算数学学报;1997年02期
中国博士学位论文全文数据库 前10条
1 杨虎;序列数据挖掘的模型和算法研究[D];重庆大学;2003年
2 郭秀娟;基于关联规则数据挖掘算法的研究[D];吉林大学;2004年
3 刘永丹;文档数据库若干关键技术研究[D];复旦大学;2004年
4 兰秋军;金融时间序列隐含模式挖掘方法及其应用研究[D];湖南大学;2005年
5 杨震;个性化信息获取方法的研究[D];大连理工大学;2004年
6 王占全;基于地理信息系统空间数据挖掘若干关键技术的研究[D];浙江大学;2005年
7 蔡中祥;基于GIS的长江河口空间决策支持研究[D];华东师范大学;2005年
8 黄超;基于特征分析的金融时间序列挖掘若干关键问题研究[D];复旦大学;2005年
9 王加阳;面向海量数据的粗糙集理论与方法研究[D];中南大学;2005年
10 陈亮;企业内部沟通中信息传递问题研究[D];中南大学;2005年
中国硕士学位论文全文数据库 前10条
1 迟凯;基于差分启发信息的模糊时间序列预测模型研究[D];昆明理工大学;2010年
2 柳建芳;基于小波消噪的聚类模式挖掘在股票收益率预测中的应用[D];武汉理工大学;2010年
3 邹丽洁;电站设备参数异动搜索分析与故障预警研究[D];华北电力大学(北京);2011年
4 林晨;基于极值理论的地震预测系统的分析与设计[D];安徽大学;2011年
5 崔美玲;基于LB_Hust距离的时间序列数据聚类[D];天津大学;2010年
6 金涛;数据挖掘在蜜罐日志分析中的应用研究[D];上海交通大学;2010年
7 谢瑞芳;基于地磁信息的新型测速方法研究[D];国防科学技术大学;2010年
8 刘晓迪;基于小波变换的金融时间序列奇异点识别模型与研究[D];昆明理工大学;2011年
9 张振华;粗集理论及其在数据预处理过程中的应用[D];昆明理工大学;2002年
10 张仕念;可测空间与Pawlak代数的关系及基于粗集理论的数据挖掘技术[D];昆明理工大学;2002年
【同被引文献】
中国期刊全文数据库 前10条
1 采峰;曾凤章;;产品需求量非平稳时序的ANN-ARMA预测模型[J];北京理工大学学报;2007年03期
2 王海东;孙新波;;国内外射孔技术发展综述[J];爆破器材;2006年03期
3 袁浩,隆克平,陈继努;电信业务预测的新方法研究[J];重庆邮电学院学报;1997年03期
4 潘保芝,薛林福,李舟波,陶宏根,王鹏;地层的自动分级对比技术[J];长春科技大学学报;2001年04期
5 付华;王雨虹;;基于数据挖掘的瓦斯灾害信息融合模型的研究[J];传感器与微系统;2008年01期
6 周远田,任康;测井曲线活度及其应用[J];测井技术;1988年06期
7 刘呈冰;王洪勇;;在计算机上实现测井曲线深度校正自动化[J];地球物理测井;1989年05期
8 袁吉诚;中国射孔技术的现状与发展[J];测井技术;2002年05期
9 成敏,朱海华,沈海燕;射孔资料自动化处理[J];测井技术;2003年01期
10 孙丽丹,王爱华,阎树汶,常峰;利用测井资料预测射孔穿透深度[J];测井技术;2004年03期
中国博士学位论文全文数据库 前10条
1 冯红伟;数据挖掘技术的研究及应用[D];西北工业大学;2002年
2 张保稳;时间序列数据挖掘研究[D];西北工业大学;2002年
3 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
4 周海燕;空间数据挖掘的研究[D];中国人民解放军信息工程大学;2003年
5 刘君强;海量数据挖掘技术研究[D];浙江大学;2003年
6 杨风召;高维数据挖掘中若干关键问题的研究[D];复旦大学;2003年
7 周伟达;核机器学习方法研究[D];西安电子科技大学;2003年
8 王达;时间序列数据挖掘研究与应用[D];浙江大学;2004年
9 王晓晔;时间序列数据挖掘中相似性和趋势预测的研究[D];天津大学;2003年
10 张瑞林;现代信息技术在煤与瓦斯突出区域预测中的应用[D];重庆大学;2004年
中国硕士学位论文全文数据库 前10条
1 高川陵;证券分析系统的研制与开发[D];北京工业大学;2001年
2 聂亚可;序列挖掘及其在证券分析中的应用[D];重庆大学;2001年
3 凌毅;神经网络在证券系统中的应用[D];北京工业大学;2002年
4 龚惠群;具有时间约束的股票序列模型及采掘算法研究[D];湖南大学;2003年
5 顾忠伟;灰色挖掘及其在证券分析中的应用研究[D];浙江大学;2003年
6 唐亮;时间序列挖掘和相似性查找技术的研究[D];上海师范大学;2004年
7 张强;聚类方法在证券行业中的应用[D];天津大学;2003年
8 张玉林;神经网络在股市预测中的建模及应用[D];大连理工大学;2004年
9 杨晴;神经网络方法在证券市场预测中的应用研究[D];电子科技大学;2004年
10 李卫民;ARMA-广义回归神经网络技术在股票预测中的应用研究[D];山东科技大学;2004年
【二级引证文献】
中国期刊全文数据库 前10条
1 郭小芳;李锋;宋晓宁;;一种基于PCA的时间序列异常检测方法[J];江西师范大学学报(自然科学版);2012年03期
2 孙兵;刘雯;田地;宋桐;富妍;;基于时间序列的数据挖掘在证券中的应用[J];吉林大学学报(信息科学版);2010年03期
3 裴丽鹊;;一种基于分段线性的FKD时间序列模式表示[J];赤峰学院学报(自然科学版);2008年07期
4 裴丽鹊;;一种基于滑动窗口的时间序列异常检测算法[J];巢湖学院学报;2011年03期
5 朱鹤;赵威;余靖;金顺福;刘国华;;排序的子序列相似查询方法[J];燕山大学学报;2009年05期
6 黄超;龚惠群;;金融领域时间序列挖掘技术研究[J];东南大学学报(哲学社会科学版);2007年05期
7 闫秋艳;夏士雄;;一种无限长时间序列的分段线性拟合算法[J];电子学报;2010年02期
8 陈卓;杨炳儒;周法国;李琳娜;;基于时态逻辑的多时间序列挖掘模型[J];辽宁工程技术大学学报(自然科学版);2009年04期
9 魏槟泽;;相似发现技术在时态数据挖掘中的应用[J];硅谷;2012年10期
10 刘瑞琴;刘学军;;WSN中基于加速动态时间弯曲的异常数据流检测[J];传感技术学报;2013年06期
中国重要会议论文全文数据库 前2条
1 刘卓军;李晓明;;一种基于时间序列异常点监测的可疑交易分析方法[A];第十三届中国管理科学学术年会论文集[C];2011年
2 邱均平;王菲菲;;时间序列相似性查询与索引方法研究[A];2009年中国索引学会年会暨学术研讨会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 倪丽萍;基于分形技术的金融数据分析方法研究[D];合肥工业大学;2010年
2 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
3 吴少智;时间序列数据挖掘在生物医学中的应用研究[D];电子科技大学;2010年
4 程文聪;面向大规模网络安全态势分析的时序数据挖掘关键技术研究[D];国防科学技术大学;2010年
5 闫秋艳;煤矿概率流数据挖掘方法研究[D];中国矿业大学;2010年
6 张可;矩阵型灰色关联分析建模技术研究[D];南京航空航天大学;2010年
7 李润恒;大规模网络中僵尸网络分析技术研究[D];国防科学技术大学;2010年
8 刘祥明;水质时间序列数据挖掘及其应用集成研究[D];重庆大学;2011年
9 孙伟;基于泄漏量监测的减压阀泄漏预测模型研究[D];上海交通大学;2012年
10 由育阳;数据流容错挖掘算法研究[D];哈尔滨工程大学;2011年
中国硕士学位论文全文数据库 前10条
1 汤雪;时间序列线性表示方法及其相似性度量算法研究[D];山东科技大学;2010年
2 赵晓燕;基于多索引的高维时间序列子序列检索研究[D];大连理工大学;2010年
3 刘军伟;基于正交变换的时间序列索引[D];大连理工大学;2010年
4 姜荣;时间序列的聚类和关联规则挖掘研究[D];辽宁师范大学;2010年
5 方如果;基于相似性分析的时间序列数据挖掘算法研究[D];浙江大学;2011年
6 陶金强;基于决策树的人才管理系统的设计与实现[D];电子科技大学;2010年
7 涂晔;时间序列模型的误差分析与研究[D];昆明理工大学;2009年
8 蔡庭锟;基于数据挖掘技术的证券投资研究[D];武汉理工大学;2010年
9 曹茸;基于时间序列的图形挖掘[D];西安电子科技大学;2009年
10 严兆斌;序列模式挖掘在公路隧道交通中的应用研究[D];西安电子科技大学;2009年
【二级参考文献】
中国期刊全文数据库 前6条
1 李斌,谭立湘,章劲松,庄镇泉;面向数据挖掘的时间序列符号化方法研究[J];电路与系统学报;2000年02期
2 马志锋,邢汉承,郑晓妹,朱平;基于多元组Rough集的不相容决策[J];东南大学学报;1999年03期
3 马志锋,邢汉承,郑晓妹;基于相似Rough集的模糊检索策略[J];计算机工程与应用;2000年02期
4 马志锋;邢汉承;郑晓妹;樊恂毅;;基于不分明与相似关系的Rough集的超图描述[J];计算机科学;1999年09期
5 黎明,严超华,刘高航;基于遗传策略和神经网络的非监督分类方法[J];软件学报;1999年12期
6 郑之开,张广凡,邵惠鹤;数据采掘与知识发现:回顾和展望[J];信息与控制;1999年05期
【相似文献】
中国期刊全文数据库 前10条
1 李中元;边馥苓;;空间同位模式挖掘研究进展[J];地理空间信息;2013年06期
2 邢东山,沈钧毅,宋擒豹;用户浏览偏爱模式挖掘算法的研究[J];西安交通大学学报;2002年04期
3 刘洪辉;吴岳芬;;用户行为模式挖掘问题的研究[J];计算机技术与发展;2006年05期
4 付晓翠;许盈;车路;;游戏访问模式挖掘的研究与应用[J];郑州大学学报(理学版);2007年04期
5 颜一鸣;郭鑫;李仁发;;一种非确定树模式挖掘算法[J];计算机工程与应用;2011年15期
6 张智;闫正龙;;地理信息公共服务平台用户行为模式挖掘关键技术研究[J];测绘技术装备;2011年03期
7 陈佐;谢赤;陈晖;;基于小波聚类方法的股票收益率序列时间模式挖掘[J];系统工程;2005年11期
8 胡继钧;;相异关系模式挖掘算法[J];数字技术与应用;2010年08期
9 程昱;古华茂;;多粒度时间下的部分周期模式挖掘[J];计算机工程;2005年24期
10 赵越;刘衍珩;余雪岗;魏达;单长伟;赵洋;;基于模式挖掘与匹配的移动轨迹预测方法[J];吉林大学学报(工学版);2008年05期
中国重要会议论文全文数据库 前10条
1 王肃;杜军平;高田;;基于本体与知识背景的模式挖掘框架研究[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
2 刘玉葆;蔡嘉荣;印鉴;黄志兰;;基于最大访问模式挖掘的数据库异常行为检测[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
3 缪裕青;尹东;;分布式存储结构的频繁闭合模式挖掘并行算法[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
4 王淼;尚学群;谢华博;李战怀;;行常量差异共表达基因模式挖掘算法研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
5 陆叶;王丽珍;陈红梅;赵丽红;;基于可能世界的不确定空间co-location模式挖掘研究[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
6 王丽珍;陆叶;陈红梅;肖清;;基于前缀树结构的空间co-location模式挖掘算法研究[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
7 胡伟成;曹三省;李丹;;一种基于QPop增量时域分割升维的媒体内容应用模式挖掘改进算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
8 薛丹;李德敏;裴仁林;;移动计算中基于PrefixSpan算法的用户移动模式挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
9 宋国杰;马帅;唐世渭;杨冬青;;基于模式挖掘的交通预测模型[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
10 夏庆;马元元;孙志挥;;路径遍历模式挖掘方法的改进[A];第十六届全国数据库学术会议论文集[C];1999年
中国重要报纸全文数据库 前1条
1 辛苑薇;谁将分享“大数据”的智慧盛宴?[N];21世纪经济报道;2012年
中国博士学位论文全文数据库 前7条
1 Shafqat Ali Shad;移动用户轨迹与行为模式挖掘方法研究[D];中国科学技术大学;2013年
2 钱烽;同位模式挖掘研究[D];浙江大学;2012年
3 刘勇;图模式挖掘技术的研究[D];哈尔滨工业大学;2010年
4 覃桂敏;复杂网络模式挖掘算法研究[D];西安电子科技大学;2012年
5 王乐;数据流模式挖掘算法及应用研究[D];大连理工大学;2013年
6 林耀进;多源环境中数据预处理与模式挖掘的研究[D];合肥工业大学;2014年
7 曾海泉;时间序列挖掘与相似性查找技术研究[D];复旦大学;2003年
中国硕士学位论文全文数据库 前10条
1 岳爱萍;基于时间的用户移动模式挖掘研究[D];西南交通大学;2008年
2 卢荣;基于动态扭曲算法的时间序列部分周期模式挖掘研究[D];天津大学;2009年
3 胡德勇;基于电信数据的模式挖掘与分析[D];北京邮电大学;2010年
4 甘海燕;基于动态链表结构的时间序列异步周期模式挖掘研究[D];天津大学;2010年
5 尹金荔;基于相似性度量的图模式挖掘研究[D];西安电子科技大学;2007年
6 徐显九;用户移动模式挖掘的研究及应用[D];西南交通大学;2007年
7 席元鸿;时间序列部分周期模式挖掘研究[D];西北师范大学;2011年
8 丛湘香;大数据下时空同现模式挖掘算法研究[D];华东理工大学;2012年
9 贾敏杰;树模式挖掘及其在树流分类中的应用研究[D];郑州大学;2012年
10 罗昊;社会网络中的时空周期行为模式挖掘算法研究[D];湖南大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026