收藏本站
《西南交通大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于相似性分析的时间序列异常检测研究

陈然  
【摘要】:随着经济的高速发展和科技的不断进步,人们对各类信息的关注和依赖也日趋增加,如何充分有效地管理和利用这些海量数据、发现这些数据背后隐含的规律和知识,就成为研究者非常关注的问题。作为数据挖掘的重要研究课题之一,时间序列的数据挖掘与预测近几年发展迅速,它将数据挖掘和时间序列联系起来,支持解决发现型问题,以从海量的时间序列数据中挖掘出有价值的、潜在的、未知的知识为目的。本文以时间序列数据的异常检测为主题,分别研究了时间序列的模式表示方法、时间序列的相似性度量、时间序列的异常检测等问题。以下是本文的主要研究工作和成果: (1)基于重要点探测技术的时间序列线性分段算法能较好的保留序列的全局特征和拟合高精确度。传统的基于重要点时间序列分段算法,只能通过误差阈值来控制分段,该方法不能预计分段数量,不能适应后期要求分段数量一定的应用。本文对该方法进行改进,通过重新调整原方法的分段次序,使用重要点组成的直线段近似描述时间序列,该方法能够在分段数量一定的情况下对时间序列分段。实验证明,该分段算法能在在固定分段数的情况下反映时间序列的主要特征,算法简单快速,整体拟合误差小。 (2)提出了一种基于PLR表示的时间序列动态平移模式距离(Dynamic Translation Pattern Distance, DTPD)。该方法由单模式距离(Single Pattern Distance, SPD)和全模式距离(Full Pattern Distance, FPD)两部分组成。单模式距离(SPD)用于比较一个单独模式之间的相似度,而全模式距离(FPD)用于比较模式组之间的相似度,也就是整条时间序列之间的相似度。全模式距离(FPD)采用了和时间序列动态弯曲距离(DTW)相似的动态弯曲思路,将单模式距离(SPD)整合为全模式距离(FPD),并以此作为候选序列之间的相似量度。实验证明,使用该方法对实验数据集进行聚类准确、高效。 (3)通过对基于k-近邻局部密度的异常检测LOF方法经行研究,将LOF方法改进后引入时间序列的异常检测中,提出一种基于局部密度的时间序列模式异常检测方法(Local Outlier Factor Based On Pattern, PLOF),该方法利用时间序列的PLR表示对原始时间序列降维,并使用时间序列单模式距离(Single Pattern Distance, SPD)对序列模式进行相似性量度,从而大大减少了原算法运算时间,而且过滤了噪声,从整体上把握了时间序列数据的“异常”模式。实验证明,该方法可准确检测出时间序列异常模式。
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP311.13

【引证文献】
中国期刊全文数据库 前1条
1 赵建秀;王洪国;邵增珍;张岳;丁艳辉;;一种基于信息熵的时间序列分段线性表示方法[J];计算机应用研究;2013年08期
中国硕士学位论文全文数据库 前1条
1 王琳;铁路轨道状态预测模型的研究[D];西南交通大学;2012年
【参考文献】
中国期刊全文数据库 前6条
1 刘世元,江浩;关于时间序列相似性概念体系的探讨与研究[J];华中科技大学学报(自然科学版);2004年07期
2 蒋嵘;基于形态表示的时间序列相似性搜索[J];计算机研究与发展;2000年05期
3 翁小清;沈钧毅;;基于滑动窗口的多变量时间序列异常数据的挖掘[J];计算机工程;2007年12期
4 林果园;郭山清;黄皓;曹天杰;;基于动态行为和特征模式的异常检测模型[J];计算机学报;2006年09期
5 贾澎涛;何华灿;刘丽;孙涛;;时间序列数据挖掘综述[J];计算机应用研究;2007年11期
6 杜奕;卢德唐;李道伦;查文舒;;基于层次聚类的时间序列在线划分算法[J];模式识别与人工智能;2007年03期
中国硕士学位论文全文数据库 前1条
1 陆薛妹;面向相似性的时间序列数据挖掘研究[D];东华大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 秦吉胜,王淑静,宋瀚涛;基于小波变换和反馈的时间序列相似模式搜索算法[J];北京理工大学学报;2004年12期
2 郭小芳;李锋;宋晓宁;;一种基于PCA的时间序列异常检测方法[J];江西师范大学学报(自然科学版);2012年03期
3 裴丽鹊;;一种基于分段线性的FKD时间序列模式表示[J];赤峰学院学报(自然科学版);2008年07期
4 董辉;方晓;方跃胜;;一种时序关联规则挖掘算法的研究与实现[J];长春工程学院学报(自然科学版);2012年01期
5 魏晓明;郭晓利;;一个基于联动策略的主动防御网络安全模型的设计[J];东北电力大学学报(自然科学版);2009年06期
6 胡飞;徐浩军;曹登高;;遗传算法在产生式规则获取中的应用[J];电光与控制;2006年03期
7 习慧丹;;数据挖掘研究综述[J];电脑与信息技术;2012年01期
8 肖建琼;宋国琴;罗兴贤;;基于时间序列数据流的孤立点自适应异常检测[J];电脑知识与技术;2011年34期
9 韩天鹏;;浅谈数据挖掘研究及其应用[J];电脑知识与技术;2012年18期
10 张洁;;基于Haar小波的时间序列相似度量算法的实现[J];福建电脑;2008年11期
中国重要会议论文全文数据库 前8条
1 徐三元;韩冰;陈清光;;基于多Agent危险源分布式监控系统的特征提取[A];中国职业安全健康协会2009年学术年会论文集[C];2009年
2 刘楚玲;谢赞福;;时间序列数据挖掘在信息系统维护中的应用[A];2008年计算机应用技术交流会论文集[C];2008年
3 ;An Anomaly Detection Approach based on Symbolic Similarity[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
4 ;A Qualitative Feature Extraction Method for Time Series Analysis[A];第25届中国控制会议论文集(下册)[C];2006年
5 邱均平;王菲菲;;时间序列相似性查询与索引方法研究[A];2009年中国索引学会年会暨学术研讨会论文集[C];2009年
6 聂亚可;陈黎;林勇;郭平;;证券量价关系的形态表示与挖掘方法研究[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
7 丁锐;孟小峰;杨楠;;一种高效的移动对象相似轨迹查询方法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
8 廖国琼;李晶;;基于距离的分布式RFID数据流孤立点检测[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 倪丽萍;基于分形技术的金融数据分析方法研究[D];合肥工业大学;2010年
2 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
3 吴少智;时间序列数据挖掘在生物医学中的应用研究[D];电子科技大学;2010年
4 程文聪;面向大规模网络安全态势分析的时序数据挖掘关键技术研究[D];国防科学技术大学;2010年
5 王海涛;低氧环境模拟医学研究平台建立与应用研究[D];山东大学;2011年
6 贺伟凇;骨干网络流量异常行为感知方法研究[D];电子科技大学;2011年
7 闫秋艳;煤矿概率流数据挖掘方法研究[D];中国矿业大学;2010年
8 杨鹏;离群检测及其优化算法研究[D];重庆大学;2010年
9 刘祥明;水质时间序列数据挖掘及其应用集成研究[D];重庆大学;2011年
10 钱爱玲;复杂结构的时间序列数据挖掘与预测方法研究[D];华中科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 汤雪;时间序列线性表示方法及其相似性度量算法研究[D];山东科技大学;2010年
2 赵晓燕;基于多索引的高维时间序列子序列检索研究[D];大连理工大学;2010年
3 刘军伟;基于正交变换的时间序列索引[D];大连理工大学;2010年
4 任芳;时间序列数据挖掘研究[D];辽宁师范大学;2010年
5 王宏云;基于数据挖掘的煤矿安全监测系统研究[D];辽宁工程技术大学;2009年
6 方如果;基于相似性分析的时间序列数据挖掘算法研究[D];浙江大学;2011年
7 迟凯;基于差分启发信息的模糊时间序列预测模型研究[D];昆明理工大学;2010年
8 张振;基于重要点模式的时间序列表示及其应用[D];昆明理工大学;2010年
9 李凯;健壮的流形学习算法及其应用研究[D];福建师范大学;2010年
10 刘瑛慧;基于粗糙集理论的数据挖掘技术在时序信号分析系统中的应用[D];大连交通大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 曾华亮,金守华,陈秀方;客运专线新建线路轨道不平顺功率谱分析[J];铁道科学与工程学报;2005年04期
2 曾志平;余志武;张向民;陈秀方;;青藏铁路无缝线路试验段轨道不平顺功率谱分析[J];铁道科学与工程学报;2008年01期
3 罗党,刘思峰,党耀国;灰色模型GM(1,1)优化[J];中国工程科学;2003年08期
4 熊岗,陈章潮;灰色预测模型的缺陷及改进方法[J];系统工程;1992年06期
5 王韶鹏;贾瑞博;;汽轮机热力性能试验中不确定度的研究[J];包钢科技;2010年02期
6 杨震;王效堂;练松良;李再帏;;合武客专无砟轨道曲线段不平顺谱分析[J];华东交通大学学报;2010年05期
7 贾瑞珍,金宗斌;高速铁路线路轨道平顺问题的探讨[J];华东交通大学学报;1997年03期
8 王成亮;用灰色与周期残差迭加模型推测地下水位未来动态[J];华北地震科学;1999年01期
9 詹艳艳;徐荣聪;陈晓云;;基于斜率提取边缘点的时间序列分段线性表示方法[J];计算机科学;2006年11期
10 周大镯;李敏强;;基于序列重要点的时间序列分割[J];计算机工程;2008年23期
中国博士学位论文全文数据库 前2条
1 肖辉;时间序列的相似性查询与异常检测[D];复旦大学;2005年
2 陈宪麦;轨道不平顺时频域分析及预测方法的研究[D];铁道部科学研究院;2006年
中国硕士学位论文全文数据库 前6条
1 卫纬;车辆—轨道系统运行安全综合评价研究[D];北京交通大学;2011年
2 常欢;济南铁路局京九线轨道质量指数TQI分析及预测研究[D];北京交通大学;2011年
3 周佳亮;基于车辆—轨道垂向耦合模型的轨道不平顺估计[D];北京交通大学;2011年
4 左玉良;轨道几何状态检测技术的应用研究[D];同济大学;2007年
5 冯建雷;基于轨检车检数据的决策树分类算法的研究与应用[D];北京交通大学;2009年
6 王伟华;土路基上双块式无砟轨道垂向动力特性分析[D];西南交通大学;2009年
【二级参考文献】
中国期刊全文数据库 前10条
1 文琪,彭宏;小波变换的离群时序数据挖掘分析[J];电子科技大学学报;2005年04期
2 李斌,谭立湘,章劲松,庄镇泉;面向数据挖掘的时间序列符号化方法研究[J];电路与系统学报;2000年02期
3 张相锋,孙玉芳,赵庆松;基于系统调用子集的入侵检测[J];电子学报;2004年08期
4 刘世元,江浩;关于时间序列相似性概念体系的探讨与研究[J];华中科技大学学报(自然科学版);2004年07期
5 蒋嵘;基于形态表示的时间序列相似性搜索[J];计算机研究与发展;2000年05期
6 靳晓明,陆玉昌,石纯一,苑森淼;时间序列的细微距离发现[J];计算机研究与发展;2000年09期
7 陈哲,冯天瑾,张海燕;基于小波神经网络的混沌时间序列分析与相空间重构[J];计算机研究与发展;2001年05期
8 段江娇;薛永生;林子雨;汪卫;施伯乐;;一种新的基于隐Markov模型的分层时间序列聚类算法[J];计算机研究与发展;2006年01期
9 刘世元,江浩;面向相似性搜索的时间序列表示方法述评[J];计算机工程与应用;2004年27期
10 汤胤;;时间序列相似性分析方法研究[J];计算机工程与应用;2006年01期
中国博士学位论文全文数据库 前1条
1 张保稳;时间序列数据挖掘研究[D];西北工业大学;2002年
中国硕士学位论文全文数据库 前2条
1 谢茂龙;面向数据挖掘应用的原型系统研究与设计[D];大连理工大学;2002年
2 徐峰;数据仓库与数据挖掘在证券业中的研究应用[D];山东大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 谭琦;杨沛;;基于集成预测的稀有时间序列检测[J];计算机应用研究;2008年09期
2 谭琦;杨沛;;基于变窗口神经网络集成的时间序列预测[J];计算机工程;2009年01期
3 周大镯;刘月芬;马文秀;;时间序列异常检测[J];计算机工程与应用;2008年35期
4 贾冠昕;杨波;陈贞翔;彭立志;;基于NetFlow时间序列的网络异常检测[J];计算机工程与应用;2008年24期
5 郝井华,刘民,吴澄,陈少卿;一种基于LLM的高维时间序列数据异常检测方法[J];控制工程;2005年03期
6 郑诚;舒坚;;多尺度时间序列异常事件检测[J];计算机工程与应用;2006年31期
7 王阅;高学东;;基于重标级差分析的时间序列分割方法[J];计算机工程与应用;2008年29期
8 刘萍;张旭;张晓华;;水文远程监控系统设计与研究[J];江苏冶金;2008年05期
9 刘宗航;;灰色数列预测模型计算的改进方案[J];中国卫生统计;1991年05期
10 李斌,谭立湘,章劲松,庄镇泉;面向数据挖掘的时间序列符号化方法研究[J];电路与系统学报;2000年02期
中国重要会议论文全文数据库 前10条
1 吴炎;杜栋;;改进BP神经网络及其对江苏省粮食产量的仿真预测[A];决策科学与评价——中国系统工程学会决策科学专业委员会第八届学术年会论文集[C];2009年
2 张玉峰;贾成刚;张文喜;;应用时间序列评估人工增雨效果[A];推进气象科技创新加快气象事业发展——中国气象学会2004年年会论文集(下册)[C];2004年
3 董永贵;张玉飞;李祎年;;一种用于时间序列异常检测的熵滤波器[A];第八届全国信息获取与处理学术会议论文集[C];2010年
4 王风宇;云晓春;曹震中;;多时间尺度同步的高速网络流量异常检测[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
5 王永忠;曾昭磐;;混沌时间序列点预测方法研究[A];1999中国控制与决策学术年会论文集[C];1999年
6 王波;张斌;;一种基于云模型的时间序列特征表示方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
7 王有良;周文国;;基于时间序列的基坑水平变形预测模型[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年
8 王玉涛;程国辉;周建常;王师;;神经网络在高炉铁水硅含量预报中的应用[A];1998中国控制与决策学术年会论文集[C];1998年
9 许伦辉;傅惠;徐建闽;;基于分形维数的交通流预测模型及算法研究[A];2003年中国智能自动化会议论文集(下册)[C];2003年
10 胡坤;刘思峰;;时间序列灰色定权聚类模型[A];2004年中国管理科学学术会议论文集[C];2004年
中国重要报纸全文数据库 前10条
1 ;《时间序列与金融数据分析》[N];中国信息报;2004年
2 东证期货 王爱华 杨卫东;两年涨跌轮回 秋季普遍下跌[N];期货日报;2009年
3 本报记者 刘松柏;“超级月球”引发地震不成立[N];经济日报;2011年
4 权证一级交易商 国信证券;正股走势及时间序列主导下半年权证市场运行结构[N];证券时报;2006年
5 房鹏;数码书信寄真情[N];中国电脑教育报;2005年
6 刘丽萍;时间序列季节调整描述经济活动的利器[N];中国信息报;2000年
7 西南证券高级研究员 董先安德圣基金研究中心 郭奔宇;预计6月CPI同比上涨7.2%[N];证券时报;2008年
8 国泰君安期货 吴泱 郑腾;基金持仓与期货价格关系的实证研究[N];期货日报;2008年
9 倪成群;人民币升值背景下中外金价和黄金投资收益关联性研究[N];期货日报;2008年
10 中期研究院 王璐 吕圳;重标极差法的期货品种收益波动性研究[N];期货日报;2008年
中国博士学位论文全文数据库 前10条
1 杨正瓴;时间序列中的混沌判定、预报及其在电力系统中的应用[D];天津大学;2003年
2 张晓伟;水文动力系统自记忆特性及其应用研究[D];西安理工大学;2009年
3 倪丽萍;基于分形技术的金融数据分析方法研究[D];合肥工业大学;2010年
4 刘大同;基于Online SVR的在线时间序列预测方法及其应用研究[D];哈尔滨工业大学;2010年
5 张永林;车辆道路数值模拟与仿真研究[D];华中科技大学;2010年
6 崔亚强;沪深300股指内在复杂性分析及预测研究[D];天津大学;2010年
7 杨谈;网络混沌行为及其控制的研究[D];北京邮电大学;2009年
8 肖辉;时间序列的相似性查询与异常检测[D];复旦大学;2005年
9 李星毅;基于相似性的交通流分析方法[D];北京交通大学;2010年
10 卢占会;电力市场稳定性研究[D];华北电力大学(河北);2008年
中国硕士学位论文全文数据库 前10条
1 杜洪波;时间序列相似性查询及异常检测算法的研究[D];沈阳工业大学;2008年
2 陈然;基于相似性分析的时间序列异常检测研究[D];西南交通大学;2011年
3 Ashraf Fetoh Eata;[D];厦门大学;2001年
4 王丽敏;两类模糊随机时间序列预测方法[D];河北大学;2001年
5 王琦;时间序列在油田效益审计中的应用[D];吉林大学;2009年
6 韩冬梅;基于P2P的教学信息资源负载均衡调度算法的研究[D];哈尔滨工程大学;2010年
7 张雷;多层次分布式智能决策支持系统及应用研究[D];西北工业大学;2006年
8 王金翠;基于实测数据的风电场风速和风功率短期预测研究[D];东北电力大学;2010年
9 赵松雷;基于频谱仪的无线自动测试系统与信号特性分析[D];北京邮电大学;2010年
10 姚兰;中国民办高等教育市场空间研究[D];河南大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026