收藏本站
《清华大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

时间序列的相似性查找方法研究

左新强  
【摘要】: 时间序列是指按时间顺序排列的一组数据,它在实际应用中无所不在,如股票数据、人口数据、温度数据、客户购物数据,以及多维空间中的运动轨迹等。如何对海量的时间序列数据进行分析处理,挖掘其蕴涵的知识信息,对于揭示事物变化和发展规律、发现不同事物之间的相互作用关系、为科学决策提供依据等具有重要的实际意义。 本文对时间序列数据挖掘应用中的关键技术——相似性查找——进行了研究,主要内容包括时间序列的符号化表示、时间序列的相似性度量以及符号序列的有效相似性度量。本文的具体工作和贡献包括: (1)时间序列的准确符号化表示 提出了一种基于局部切分的时间序列符号化方法。它解决了滑动窗口切分带来的不准确问题。与已有方法相比,实验结果表明了提出的方法在表示准确性方面的明显优势。并提出了针对这种表示的相似性度量方法,采用层次聚类策略进行了聚类实验,能得到比以前的方法更好的精度。 (2)时间序列相似性度量的层次模型 在时间序列相似性度量中,提出了同层次的点进行比较的思想。基于该思想设计了层次度量模型,并利用快速傅里叶变换实现了两种实际的算法。为了加快在数据库中搜索的速度,提出了有效的过滤算法。k近邻查询和聚类实验结果表明层次模型能够得到比以前方法更好的准确性;时间性能以及过滤性能的测试实验表明了该方法在时间复杂度方面的优势,可以较好地在实际中应用。 (3)有效的符号序列编辑距离模型 为了提高编辑距离度量符号序列相似性的效果,将数据依赖性引入到编辑距离模型中,给出了一种较经典编辑距离模型更有效的相似模型定义。该定义量化了编辑操作中操作数据和周围数据对序列内容改变大小的影响。通过信息论的解释证明了这种设计的正确性。为了提高在数据库中的搜索效率,提出了一种快速滤除方法。实验结果表明,该方法可以有效地提高了符号序列相似性度量的效果。
【学位授予单位】:清华大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP301

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 王燕;马倩倩;韩萌;;基于特征点分段的多元时间序列相似性搜索[J];计算机工程与应用;2012年33期
中国重要会议论文全文数据库 前1条
1 邱均平;王菲菲;;时间序列相似性查询与索引方法研究[A];2009年中国索引学会年会暨学术研讨会论文集[C];2009年
中国硕士学位论文全文数据库 前8条
1 汤雪;时间序列线性表示方法及其相似性度量算法研究[D];山东科技大学;2010年
2 练仕榴;生物医学信号的相似性度量研究[D];天津理工大学;2011年
3 高沛;智能家庭网络流量异常检测的研究与实现[D];西北大学;2010年
4 刘姝琼;支持向量机和证据理论在暂态稳定评估中的应用研究[D];华北电力大学(河北);2010年
5 都彬;基于数据挖掘技术的股票预测与研究[D];江苏科技大学;2012年
6 李鑫;三性法与静中动判据预测大地震的应用研究及物理基础探讨[D];中国地震局兰州地震研究所;2012年
7 张英杰;基于时间序列分析的隧道传感器数据预测研究[D];西安电子科技大学;2011年
8 马倩倩;多元时间序列相似性搜索算法研究[D];兰州理工大学;2013年
【同被引文献】
中国期刊全文数据库 前10条
1 曲文龙;张德政;杨炳儒;;基于小波和动态时间弯曲的时间序列相似匹配[J];北京科技大学学报;2006年04期
2 张建勋;刘羽;;基于多分辨率图像锥与Hausdorff距离的医学图像配准[J];重庆理工大学学报(自然科学版);2010年01期
3 周皓;李少洪;;支持向量机与证据理论在信息融合中的结合[J];传感技术学报;2008年09期
4 夏宇;朱欣焰;;高维空间数据索引技术研究[J];测绘科学;2009年01期
5 张金泽;单甘霖;;SVM与证据理论集成的信息融合故障诊断技术研究[J];电光与控制;2007年04期
6 陆明勇,黄辅琼,刘善华,高福旺;地壳变形与地下水相互作用及其异常关系初探[J];地震;2005年01期
7 刘桂萍;;关于我国地震预测预报发展的几点思考[J];地震;2010年01期
8 李向军;;一种基于经验模式分解的心电QRS波检测方法[J];电子科技大学学报;2007年04期
9 杨永林;苏琴;;鲜水河断裂带现今活动特征研究[J];大地测量与地球动力学;2007年06期
10 方怡;王建;王晓茹;;电力系统暂态稳定评估的关联规则挖掘[J];电力建设;2008年02期
中国博士学位论文全文数据库 前10条
1 吴佳文;水文时间序列数据挖掘算法研究与应用[D];沈阳农业大学;2011年
2 张保稳;时间序列数据挖掘研究[D];西北工业大学;2002年
3 王晓晔;时间序列数据挖掘中相似性和趋势预测的研究[D];天津大学;2003年
4 兰秋军;金融时间序列隐含模式挖掘方法及其应用研究[D];湖南大学;2005年
5 林志贵;基于证据理论的信息融合研究及其在水质监测中的应用[D];河海大学;2005年
6 马骞;电网调度决策支持系统的研究[D];华北电力大学(北京);2005年
7 肖辉;时间序列的相似性查询与异常检测[D];复旦大学;2005年
8 张晋昕;医学时间序列分析及其预测应用相关问题的研究[D];第四军医大学;2000年
9 谢景新;非线性多步预测与优化方法及其在水文预报中的应用[D];大连理工大学;2006年
10 曲吉林;时间序列挖掘中索引与查询技术的研究[D];天津大学;2006年
中国硕士学位论文全文数据库 前10条
1 刘艳芳;基于神经网络和支持向量机的暂态稳定评估方法研究[D];华北电力大学(河北);2003年
2 谢远国;心电波形的检测与分类技术研究[D];天津大学;2004年
3 祁晓笑;数据挖掘在电力系统暂态稳定评估中的应用[D];西安理工大学;2005年
4 徐峰;数据仓库与数据挖掘在证券业中的研究应用[D];山东大学;2005年
5 汪马翔;基于PMU测量数据的暂态稳定预测分类特征选择[D];华北电力大学(河北);2006年
6 曹旌;基于模式识别的电力系统暂态稳定评估技术的研究[D];天津大学;2005年
7 张海;基于扩展等面积法的电力系统暂态稳定分析[D];太原理工大学;2006年
8 张军;基于时间序列相似性的数据挖掘方法研究[D];东南大学;2006年
9 毛云建;多维时间序列数据挖掘的方法研究及应用[D];上海交通大学;2007年
10 朱德康;基于智能控制的隧道通风节能系统的研究[D];湖南大学;2007年
【二级引证文献】
中国期刊全文数据库 前1条
1 曹鹏云;付秋娟;宫会丽;杨宁;;高维空间下烟叶质量相似性度量方法研究[J];中国烟草科学;2013年03期
中国硕士学位论文全文数据库 前2条
1 史国洁;纸质心电图数字化信息提取的关键问题研究[D];天津理工大学;2012年
2 韩萌;多元时间序列数据挖掘中相似性算法的研究[D];兰州理工大学;2014年
【相似文献】
中国期刊全文数据库 前10条
1 郑诚;舒坚;;多尺度时间序列异常事件检测[J];计算机工程与应用;2006年31期
2 王阅;高学东;;基于重标级差分析的时间序列分割方法[J];计算机工程与应用;2008年29期
3 刘萍;张旭;张晓华;;水文远程监控系统设计与研究[J];江苏冶金;2008年05期
4 刘宗航;;灰色数列预测模型计算的改进方案[J];中国卫生统计;1991年05期
5 李斌,谭立湘,章劲松,庄镇泉;面向数据挖掘的时间序列符号化方法研究[J];电路与系统学报;2000年02期
6 陈乃塘;;PCI接口技术总校阅(下)[J];电子测试;2003年12期
7 张树瑜,朱仲英;一种基于AF的决策树算法[J];系统工程与电子技术;2005年07期
8 张军,陈汉武,马志民;一种时间序列相似性的快速搜索算法[J];南京师范大学学报(工程技术版);2005年03期
9 黄超,吴清烈,武忠,朱扬勇;基于自相似的金融时间序列波动聚集性研究[J];计算机工程与应用;2005年32期
10 曲文龙;张德政;杨炳儒;;基于小波和动态时间弯曲的时间序列相似匹配[J];北京科技大学学报;2006年04期
中国重要会议论文全文数据库 前10条
1 吴炎;杜栋;;改进BP神经网络及其对江苏省粮食产量的仿真预测[A];决策科学与评价——中国系统工程学会决策科学专业委员会第八届学术年会论文集[C];2009年
2 张玉峰;贾成刚;张文喜;;应用时间序列评估人工增雨效果[A];推进气象科技创新加快气象事业发展——中国气象学会2004年年会论文集(下册)[C];2004年
3 王永忠;曾昭磐;;混沌时间序列点预测方法研究[A];1999中国控制与决策学术年会论文集[C];1999年
4 王波;张斌;;一种基于云模型的时间序列特征表示方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
5 王有良;周文国;;基于时间序列的基坑水平变形预测模型[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年
6 王玉涛;程国辉;周建常;王师;;神经网络在高炉铁水硅含量预报中的应用[A];1998中国控制与决策学术年会论文集[C];1998年
7 许伦辉;傅惠;徐建闽;;基于分形维数的交通流预测模型及算法研究[A];2003年中国智能自动化会议论文集(下册)[C];2003年
8 胡坤;刘思峰;;时间序列灰色定权聚类模型[A];2004年中国管理科学学术会议论文集[C];2004年
9 蒋斌松;韩立军;贺永年;;时间序列Lyapunov指数的估算及预测[A];矿山建设工程新进展——2005全国矿山建设学术会议文集(下册)[C];2005年
10 何全军;曹静;张月维;;基于MODIS的广东省植被指数序列构建与应用[A];中国气象学会2007年年会生态气象业务建设与农业气象灾害预警分会场论文集[C];2007年
中国重要报纸全文数据库 前10条
1 ;《时间序列与金融数据分析》[N];中国信息报;2004年
2 东证期货 王爱华 杨卫东;两年涨跌轮回 秋季普遍下跌[N];期货日报;2009年
3 本报记者 刘松柏;“超级月球”引发地震不成立[N];经济日报;2011年
4 权证一级交易商 国信证券;正股走势及时间序列主导下半年权证市场运行结构[N];证券时报;2006年
5 房鹏;数码书信寄真情[N];中国电脑教育报;2005年
6 刘丽萍;时间序列季节调整描述经济活动的利器[N];中国信息报;2000年
7 西南证券高级研究员 董先安德圣基金研究中心 郭奔宇;预计6月CPI同比上涨7.2%[N];证券时报;2008年
8 国泰君安期货 吴泱 郑腾;基金持仓与期货价格关系的实证研究[N];期货日报;2008年
9 倪成群;人民币升值背景下中外金价和黄金投资收益关联性研究[N];期货日报;2008年
10 中期研究院 王璐 吕圳;重标极差法的期货品种收益波动性研究[N];期货日报;2008年
中国博士学位论文全文数据库 前10条
1 杨正瓴;时间序列中的混沌判定、预报及其在电力系统中的应用[D];天津大学;2003年
2 张晓伟;水文动力系统自记忆特性及其应用研究[D];西安理工大学;2009年
3 倪丽萍;基于分形技术的金融数据分析方法研究[D];合肥工业大学;2010年
4 刘大同;基于Online SVR的在线时间序列预测方法及其应用研究[D];哈尔滨工业大学;2010年
5 张永林;车辆道路数值模拟与仿真研究[D];华中科技大学;2010年
6 崔亚强;沪深300股指内在复杂性分析及预测研究[D];天津大学;2010年
7 杨谈;网络混沌行为及其控制的研究[D];北京邮电大学;2009年
8 李星毅;基于相似性的交通流分析方法[D];北京交通大学;2010年
9 肖辉;时间序列的相似性查询与异常检测[D];复旦大学;2005年
10 卢占会;电力市场稳定性研究[D];华北电力大学(河北);2008年
中国硕士学位论文全文数据库 前10条
1 Ashraf Fetoh Eata;[D];厦门大学;2001年
2 王丽敏;两类模糊随机时间序列预测方法[D];河北大学;2001年
3 王琦;时间序列在油田效益审计中的应用[D];吉林大学;2009年
4 韩冬梅;基于P2P的教学信息资源负载均衡调度算法的研究[D];哈尔滨工程大学;2010年
5 张雷;多层次分布式智能决策支持系统及应用研究[D];西北工业大学;2006年
6 王金翠;基于实测数据的风电场风速和风功率短期预测研究[D];东北电力大学;2010年
7 赵松雷;基于频谱仪的无线自动测试系统与信号特性分析[D];北京邮电大学;2010年
8 姚兰;中国民办高等教育市场空间研究[D];河南大学;2007年
9 吴烨清;时间序列理论在软件可靠性建模中的应用和研究[D];华中农业大学;2009年
10 曹晓琴;非线性优化的混合算法及其应用[D];燕山大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026