收藏本站
《东南大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于时间序列相似性的数据挖掘方法研究

张军  
【摘要】: 时间序列数据是一类重要的复杂数据对象,广泛存在于自然现象和社会经济等领域中,应用数据挖掘技术分析时间序列数据是一项具有现实意义的工作,数据挖掘技术应用于时间序列数据库能够发现时间序列中所蕴涵的知识,数据挖掘技术在时间序列中的主要应用有规则发现、周期模式挖掘、相似性搜索和序列模式发现等方面。本文探讨时间序列的相似性度量及相似子序列的搜索方法。 时间序列数据具有高维性、含噪声、振幅轴伸缩、时间轴漂移等多种变形,这造成时间序列数据挖掘困难,对时间序列数据首先进行去噪声和规范化预处理,包括数据填补缺失、数据清洗、维数约减,消除不一致等技术,得到高质量的数据以便处理。 在目前时间序列相似性挖掘的研究中,对时间序列数据库的描述、存储、检索等操作,通常都是基于序列幅度值和时间坐标进行的。采用以点距离为度量标准。如线性平均分段累积近似方法(PAA, Piecewise Aggregate Approximation),点距离不能克服时间序列幅度值伸缩和时间轴漂移以及高维误匹配等方面的不足,为此本文提出以时间序列模式距离为度量的标准,直观时间序列曲线变化,会发现一些能标志时间序列曲线动态变化的点,将其称作关键点,以关键点为边界分割时间序列,用各分段拟合时间序列变化模式,提取各分段拟合的形态特征向量(斜率反正切值)。关键点的选择必须满足各段线性拟合的误差阈值,为提高分段线性拟合的准确性,提出一种相对误差阈值的改进算法,使关键点反映时间序列变化的总体趋势和特征。 在现有相似子序列搜索方法的基础上,根据其不足,本文提出改进算法,首先考虑各分段线性拟合的时间跨度。海量的时间序列数据库各段模式特征的存储搜索的规模很大,将分段序列的特征向量进行离散化分类,以字符代替各分段时间序列,后缀树结构存储各分段序列的形态特征字符,在给定序列树中快速有效地检索与查询序列相似的子序列,这种算法能够对不同取值范围、不同长度的子序列进行有效的搜索,实现了序列数据库在不同划分粒度下的相似性检索。提出离散化边界模糊分类的方法,实验表明此改进方法优化了相似子序列的查全率。本文最后与目前的PAA方法比较,通过实验证明关键点分割线性拟合的方法有效可行。相对误差修正方法,增加关键点数,相应提高了相似搜索的查全率,但所需的时间较长,有待以后的研究中得以提高。
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP311.13

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前9条
1 林香;证券分析中数据挖掘模型的研究及应用[D];厦门大学;2007年
2 李健;城市中心区交叉口流量时变特征研究[D];同济大学;2008年
3 王璐;风电场的风速预测与主轴故障诊断[D];华北电力大学(北京);2010年
4 罗婷婷;基于多模型的农产品供求信息分析预测系统研究[D];中国农业科学院;2010年
5 廖娟;时间序列相似匹配在风暴潮辅助决策系统中的应用研究[D];上海海洋大学;2012年
6 张英杰;基于时间序列分析的隧道传感器数据预测研究[D];西安电子科技大学;2011年
7 周志强;基于时间序列分析的隧道通风控制研究[D];西安电子科技大学;2011年
8 张婷婷;基于ARMA模型的时间序列挖掘[D];合肥工业大学;2013年
9 董曼丽;基于时序分析的隧道通风控制技术研究[D];西安电子科技大学;2013年
【参考文献】
中国期刊全文数据库 前4条
1 蔡智,岳丽华,王熙法;时序模式发现算法研究[J];计算机研究与发展;2000年09期
2 刘世元,江浩;面向相似性搜索的时间序列表示方法述评[J];计算机工程与应用;2004年27期
3 李爱国,覃征;在线分割时间序列数据[J];软件学报;2004年11期
4 王明江,唐璞山;基于矢量斜率的分段线性拟合[J];软件学报;1999年02期
中国博士学位论文全文数据库 前1条
1 冯红伟;数据挖掘技术的研究及应用[D];西北工业大学;2002年
中国硕士学位论文全文数据库 前1条
1 杨敏;水文时间序列相似性模型的研究与应用[D];河海大学;2002年
【共引文献】
中国期刊全文数据库 前10条
1 张辉;李桐林;董瑞霞;;基于电偶源的体积分方程法三维电磁反演[J];吉林大学学报(地球科学版);2006年02期
2 刘童;孙吉贵;张永刚;白洪涛;;用周期模型和近邻算法预测话务量时间序列[J];吉林大学学报(信息科学版);2007年03期
3 孙兵;刘雯;田地;宋桐;富妍;;基于时间序列的数据挖掘在证券中的应用[J];吉林大学学报(信息科学版);2010年03期
4 唐秋生;李萍;;交通事故回归分析中对样本缺损的技术处理[J];重庆交通学院学报;2006年01期
5 王国庆;应国淼;尤春涛;;破片式战斗部对飞机目标的杀伤方法[J];四川兵工学报;2009年05期
6 高学东,赵阳;时间序列分析斜率反正切模式表示法的实现[J];科技和产业;2005年11期
7 冯丽,邱家驹;离群数据挖掘及其在电力负荷预测中的应用[J];电力系统自动化;2004年11期
8 袁贵川,程利,王建全;利用数据挖掘进行短期电价预测[J];电力系统及其自动化学报;2003年02期
9 张辉;李桐林;董瑞霞;;体积分方程法模拟电偶源三维电磁响应[J];地球物理学进展;2006年02期
10 张蓉生;李立;魏学锋;李娜;章胜玲;;基于最小像素误差控制的曲线矢量数据自适应数学描述[J];电子学报;2008年11期
中国重要会议论文全文数据库 前3条
1 江兵;高伟良;刘少伟;;时序模型拟合优度的TOPSIS评价法及其应用[A];第九届中国管理科学学术年会论文集[C];2007年
2 赵哲;孙婷;陈立军;崔斌;;一种数据流上的快速分段算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
3 涂宇;刘玉葆;方仲康;曾苗;刘俊裕;;基于重要点的多分辨率检索法的时间序列表示[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 汤春瑞;水下目标声图像多分辨率分析及识别研究[D];哈尔滨工程大学;2009年
2 姜海明;光纤Raman放大器增益谱平坦化研究[D];电子科技大学;2011年
3 刘祥明;水质时间序列数据挖掘及其应用集成研究[D];重庆大学;2011年
4 吴佳文;水文时间序列数据挖掘算法研究与应用[D];沈阳农业大学;2011年
5 张习文;基于单义域邻接图的扫描工程图样自组织智能识别理论与技术研究[D];大连理工大学;2000年
6 刘君强;海量数据挖掘技术研究[D];浙江大学;2003年
7 黄超;基于特征分析的金融时间序列挖掘若干关键问题研究[D];复旦大学;2005年
8 张辉;复电阻率三维电磁场正反演研究[D];吉林大学;2006年
9 张昱;基于机器视觉的TFT-LCD屏mura缺陷检测技术研究[D];哈尔滨工业大学;2006年
10 吴绍春;地震预报中的数据挖掘方法研究[D];上海大学;2005年
中国硕士学位论文全文数据库 前10条
1 林鑫;城市道路交通流数据的挖掘[D];天津理工大学;2010年
2 林孙奔;一种基于电机转子转动惯量的电机特性测试系统研究[D];浙江大学;2011年
3 张燕蓟;基于访问日志的聚类分析和个性化推荐应用研究[D];南京大学;2011年
4 余小双;遗传算法及其在数据挖掘中的应用研究[D];武汉纺织大学;2010年
5 卢锦;时间序列关联规则在IT上市企业股价趋势分析中的应用研究[D];华东交通大学;2010年
6 崔美玲;基于LB_Hust距离的时间序列数据聚类[D];天津大学;2010年
7 王妍;基于Web使用挖掘的浏览兴趣预测及个性化推荐策略研究[D];哈尔滨工业大学;2011年
8 宣国庆;基于神经网络交叉覆盖算法的学生成绩预测[D];安徽大学;2011年
9 王春磊;液体随行装药喷射雾化与燃烧数值模拟及分析[D];南京理工大学;2012年
10 赵晶晶;基于时序趋势特征的回转窑喂煤SVM分类方法[D];湖南大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 王江红;于丽莹;马英慧;刘红欣;栾天浩;;灰色GM(1,1)模型预测吉林省高粱播种面积[J];安徽农学通报;2007年20期
2 宋军良;;美国农产品的供求信息服务[J];安徽农业科学;2006年10期
3 李琼;毛雪岷;;基于传递函数模型的台风中心气压动态预测[J];安徽农业科学;2010年25期
4 李学伟,关忠良;Box-Jenkins 传统时序建模方法的改进[J];北方交通大学学报;1998年03期
5 曹彤,乔宇;时间序列分析中的ARMA算法及其软件实现[J];北京联合大学学报;1996年02期
6 程贤禄;北京市农产品批发市场蔬菜价格预测预报体系研究[J];北京农业科学;2002年02期
7 瞿晓;陈伟;葛丁飞;;一种计算简单的心电诊断算法的研究[J];传感技术学报;2007年04期
8 张淑清;陈白;张立国;;小波分析算法研究及在齿轮与滚动轴承故障诊断中应用[J];传感技术学报;2007年05期
9 张红燕;贺艳辉;袁永明;;江苏水产品市场信息系统的设计与实现[J];长江大学学报(自科版)农学卷;2006年02期
10 吴琦;用ASP实现对WEB数据库的访问[J];长江职工大学学报;2003年04期
中国重要会议论文全文数据库 前2条
1 曹聪梅;甘仞初;;非平稳时间序列预测模型在农产品供求量预测中的应用研究[A];2003年中国管理科学学术会议论文集[C];2003年
2 韩直;;秦岭终南山特长公路隧道通风控制研究[A];中国公路学会2005年学术年会论文集(上)[C];2005年
中国博士学位论文全文数据库 前10条
1 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
2 张保稳;时间序列数据挖掘研究[D];西北工业大学;2002年
3 曾海泉;时间序列挖掘与相似性查找技术研究[D];复旦大学;2003年
4 王晓晔;时间序列数据挖掘中相似性和趋势预测的研究[D];天津大学;2003年
5 王勇;时序数据挖掘技术及其在水质预测中的应用研究[D];广东工业大学;2005年
6 周剑峰;城市交通共用信息平台数据处理技术研究[D];吉林大学;2005年
7 肖辉;时间序列的相似性查询与异常检测[D];复旦大学;2005年
8 吴明先;高速公路隧道集成化智能化监控技术与系统开发研究[D];长安大学;2004年
9 文鸿雁;基于小波理论的变形分析模型研究[D];武汉大学;2004年
10 蒋乃华;中国粮食生产与价格波动研究[D];南京农业大学;1998年
中国硕士学位论文全文数据库 前10条
1 尚军亮;时间序列预测方法及在隧道控制中的应用研究[D];西安电子科技大学;2010年
2 韩海山;经济预测统计模型的研究与应用[D];大连理工大学;2000年
3 李莉莉;非时期经济时间序列分析及应用[D];山东师范大学;2000年
4 高川陵;证券分析系统的研制与开发[D];北京工业大学;2001年
5 聂亚可;序列挖掘及其在证券分析中的应用[D];重庆大学;2001年
6 凌毅;神经网络在证券系统中的应用[D];北京工业大学;2002年
7 马永杰;公路隧道纵向通风神经模糊控制系统应用研究[D];西南交通大学;2003年
8 孙巧燕;隧道通风和火灾报警系统研究[D];长安大学;2002年
9 顾忠伟;灰色挖掘及其在证券分析中的应用研究[D];浙江大学;2003年
10 唐亮;时间序列挖掘和相似性查找技术的研究[D];上海师范大学;2004年
【二级引证文献】
中国期刊全文数据库 前1条
1 翟一然;王勤耕;宋媛媛;;长江三角洲地区能源消费大气污染物排放特征[J];中国环境科学;2012年09期
中国硕士学位论文全文数据库 前8条
1 胡海霞;基于灰色系统与时间序列的矿产资源产量预测[D];成都理工大学;2011年
2 陈苏;基于数据挖掘技术的金融指数预测[D];华东理工大学;2012年
3 李嘉裕;数据挖掘方法在沪深300指数收益率波动预测的应用研究[D];厦门大学;2008年
4 宋桐;基于时间序列的数据挖掘在证券分析中的应用[D];吉林大学;2009年
5 郑纪安;基于小波分析和神经网络的金融时间序列预测研究[D];厦门大学;2009年
6 张子杰;数据挖掘在高尔夫球场虫害预测的应用[D];华南理工大学;2009年
7 韩跃;夏季温室降温预测与模拟研究[D];黑龙江八一农垦大学;2012年
8 詹伟成;数据挖掘在移动通信性能指标中的应用研究[D];上海交通大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 蒋嵘;基于形态表示的时间序列相似性搜索[J];计算机研究与发展;2000年05期
2 靳晓明,陆玉昌,石纯一,苑森淼;时间序列的细微距离发现[J];计算机研究与发展;2000年09期
3 蔡智,岳丽华,王熙法;时序模式发现算法研究[J];计算机研究与发展;2000年09期
4 李爱国,覃征;具有FIR突触的积单元神经网络预测时间序列[J];计算机研究与发展;2004年04期
5 段立娟;高文;王伟强;;时序数据库中相似序列的挖掘[J];计算机科学;2000年05期
6 朱明,蔡庆生;基于约束满足的相似时序数据的搜索算法[J];计算机工程;2000年01期
7 冯红伟,张阳,李多,胡正国;一个带有Cache的检索系统的设计与性能研究[J];计算机应用研究;2001年07期
8 王明江,唐璞山;基于矢量斜率的分段线性拟合[J];软件学报;1999年02期
9 李爱国,覃征,贺升平;时间序列数据的相似模式抽取[J];西安交通大学学报;2002年12期
10 覃征,李爱国;时间序列数据的稳健最优分割方法[J];西安交通大学学报;2003年04期
【相似文献】
中国期刊全文数据库 前10条
1 刘秀峰 ,詹秀菊;面向电子商务的数据挖掘技术[J];现代通信;2003年06期
2 孙京兰;;OLAP技术及数据挖掘 技术[J];中文信息;2003年04期
3 冯进;利用数据挖掘技术 深入挖掘图书馆工作[J];现代情报;2005年03期
4 王小燕;数据挖掘技术在超市中的应用研究[J];商场现代化;2005年05期
5 方忠祥,屠立;数据挖掘技术在客户关系管理中的应用研究[J];机床与液压;2005年06期
6 龙腾芳;数据挖掘技术在农业领域中的应用研究[J];微计算机信息;2005年08期
7 周勇;数据挖掘技术发展综述[J];中国科技信息;2005年16期
8 徐守军,高波,甄蓓,彭奕,王东根,王玉民,吴乐山;数据挖掘技术在科研管理中应用前景初探[J];中华医学科研管理杂志;2005年04期
9 张特来,刘万军;数据挖掘在医学领域的应用研究[J];自动化技术与应用;2005年10期
10 杨小云;;数据挖掘在图书馆中的应用[J];渭南师范学院学报;2005年S2期
中国重要会议论文全文数据库 前10条
1 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
2 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
3 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
4 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
5 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
6 王洪锋;;数据挖掘在客户关系管理中的应用研究[A];河南省通信学会2005年学术年会论文集[C];2005年
7 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
8 张婧;;数据挖掘技术在进销存系统中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
9 杨利军;勾学荣;;数据挖掘在移动客户流失预测中的研究和应用[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
10 孙义明;曾继东;;数据挖掘技术及其应用[A];全国计算机安全学术交流会论文集(第二十二卷)[C];2007年
中国重要报纸全文数据库 前10条
1 彭冰灿,刘厚兵;营业税筹划要找准关键点[N];中国税务报;2005年
2 记者 曹湘黔;抓好三个关键点 让农民得实惠[N];自贡日报;2008年
3 刘波 曾启明;突出关键点 找准切入点 抓好实践点[N];人民武警;2008年
4 王涛;测试是TD-SCDMA 商用关键点[N];通信产业报;2005年
5 记者  滕建福 邹立新;交通建设是协调发展的关键点和突破口[N];中国交通报;2006年
6 本报记者 王玉梅;建设和谐社会 文化要交流共进[N];中国新闻出版报;2007年
7 ;十大“牛气冲天”人物[N];电脑报;2007年
8 中共商丘市委组织部研究室主任 刘福奎;抓好关键点 盘活人才资源[N];商丘日报;2008年
9 潍坊检验检疫局副局长 李金山;关键点 着力点 支撑点[N];中国国门时报;2005年
10 武汉新兰德 涂人猛;关注1981关键点位[N];中国信息报;2000年
中国博士学位论文全文数据库 前10条
1 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
2 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
3 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
4 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
5 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
6 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
7 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
8 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
9 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 张军;基于时间序列相似性的数据挖掘方法研究[D];东南大学;2006年
2 刘静;基于数据挖掘的证券公司客户细分及其应用研究[D];同济大学;2008年
3 宋桐;基于时间序列的数据挖掘在证券分析中的应用[D];吉林大学;2009年
4 赵林明;基于数据仓库的信用卡数据挖掘研究[D];山东科技大学;2005年
5 陈骏武;基于数据挖掘技术的电信客户关系管理研究[D];湖南大学;2005年
6 房静;面向CRM的数据挖掘在电力市场营销中的应用[D];天津大学;2004年
7 罗国甫;数据挖掘在银行客户经理考核系统中的应用[D];同济大学;2006年
8 王鑫;数据挖掘中聚类分析算法的研究[D];山东师范大学;2006年
9 袁明;基于网格的数据挖掘应用研究[D];西安电子科技大学;2007年
10 左红武;基于数据挖掘的房地产企业客户关系管理研究[D];昆明理工大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026