收藏本站
《东华大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

面向相似性的时间序列数据挖掘研究

陆薛妹  
【摘要】: 时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列,在经济、金融、科学观测和工程等各个领域都广泛存在。如何有效地管理和利用这些历史时间序列,发现这些数据背后隐含的规律和知识,是人们广泛关注的问题。与传统时间序列分析提出假设然后进行验证的数据处理方法不同,时间序列数据挖掘适合发现型任务,能够从大量历史数据中挖掘出潜在的、未知的、有价值的知识。 本文以面向相似性的时间序列数据挖掘为主题,从时间序列的相似性研究出发,研究了时间序列的表示方法、时间序列的相似性度量、相似性搜索和索引、时间序列数据挖掘的原型系统等问题。本文的主要研究工作和成果概括如下: (1)提出了分段极值特征提取的时间序列表示方法。本文在分析和比较了原有的各种时间序列表示方法后,以分段线性表示法为基础,参考界标模型的思想,提出了分段极值特征提取的时间序列表示方法,克服了很多其他时间序列表示方法都无法同时客观地描述时间序列的整体趋势和局部特征的矛盾。本文并以实验数据验证了该算法的正确性和高效性。 (2)提出了分段极值DTW距离的相似性度量方法。本文在立足于几种典型的时间序列相似性度量方法基础上,通过各种方法的分析比较与借鉴,提出了一种基于分段极值DTW距离的时间序列相似性度量方法,并通过实验验证了该算法的有效性与准确性。与欧氏距离相比,该方法有更广的适用性,能够对发生时间轴伸缩和弯曲的序列进行相似性度量,并且保证了度量的准确性;与传统的DTW距离算法相比,分段极值DTW距离算法在计算效率上得到了大大提高,克服了DTW距离算法计算量大的问题,这也为时间序列数据挖掘的实现奠定了基础。 (3)研究了基于DTW距离的时间序列相似性搜索。为了能够在海量的时间序列数据库中快速、准确地进行相似性搜索,本文首先运用多维空间索引结构R~*-树对预处理过的时间序列进行索引,以此提高了相似性搜索的效率。在此基础上,以DTW距离作为相似性度量方法,保证了度量的鲁棒性。最后通过R~*-树的索引查找来实现时间序列的相似性搜索。本文同时以三种典型的相似性搜索算法证明了在时间序列数据库中进行全序列匹配搜索和子序列匹配搜索的可行性。 (4)提出了一个集成的时间序列数据挖掘原型系统的结构模型。时间序列分析系统在许多领域中都有很强的应用价值,在分析比较了以往的时间序列分析系统和工具的功能特点后,提出了一个集成的时间序列数据挖掘原型系统的结构模型,并阐述了该原型系统的具体应用。
【学位授予单位】:东华大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP311.13

【相似文献】
中国期刊全文数据库 前10条
1 于辉;张忠秋;王丽芳;;一种有效的无序多图像分组及其拓扑有序化的算法[J];西北工业大学学报;2011年03期
2 郑成文;韩柯;张海粟;;一种改进的软件自适应随机测试策略[J];计算机工程;2011年16期
3 龚伟林;李德玉;王素格;程利涛;;基于模糊区分矩阵的区间值信息系统属性约简[J];山西大学学报(自然科学版);2011年03期
4 冯宇平;赵文仓;;基于局部灰度值编码的图像匹配[J];青岛科技大学学报(自然科学版);2011年04期
5 郭晓娟;李长江;梁玉琪;;多特征融合中自动调整权值的图像检索方法[J];河南科技学院学报(自然科学版);2011年04期
6 王雪蓉;万年红;;云模式用户行为关联聚类的协同过滤推荐算法[J];计算机应用;2011年09期
7 何中海;何彬彬;;基于权重光谱角制图的高光谱矿物填图方法[J];光谱学与光谱分析;2011年08期
8 陈蕾;杨庚;张迎周;陈燕俐;;基于核Batch SOM聚类优化的语义Web服务发现机制研究[J];电子与信息学报;2011年06期
9 刘渭滨;刘幸奇;邢薇薇;袁保宗;;通过语义控制改进运动合成[J];计算机研究与发展;2011年07期
10 于哲夫;路慧彪;贾传荧;;一种快速混合核函数参数选择方法[J];大连海事大学学报;2011年03期
中国重要会议论文全文数据库 前10条
1 刘喜平;万常选;;一种二维的树型文档结构相似性度量[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 杨艳春;孟祥武;;P2P网络服务环境中的节点相似性度量研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
3 廉鑫;林伟坚;张海威;袁晓洁;;基于双向路径约束模型的XML文档结构相似性度量[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
4 何昕;谢志鹏;;基于简单树匹配算法的Web页面结构相似性度量[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
5 杨明;杨萍;吉根林;;分布式环境下的隐私保持数据库相似性度量[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
6 郑成文;张海粟;韩柯;陈昱松;张乐飞;;一种基于相似性度量的软件测试方法[A];第六届中国测试学术会议论文集[C];2010年
7 唐宏;杨新;方涛;施鹏飞;;基于核方法的光谱角制图模型及其在高光谱图像分割中的应用[A];中国地理信息系统协会第八届年会论文集[C];2004年
8 马凯;苏一丹;;一种基于序列相似性的蚁群聚类算法[A];广西计算机学会2009年年会论文集[C];2009年
9 董小莉;黄元元;刘宁钟;;基于矩特征和信息熵的商标图像检索方法[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
10 杜培军;陈云浩;;高光谱遥感信息中光谱向量编码方法的研究[A];第十五届全国遥感技术学术交流会论文摘要集[C];2005年
中国重要报纸全文数据库 前2条
1 甘仞初(中国):北京理工大学管理与经济学院首席教授,IFIP中国计算机辅助生产管理专委会主席;基于案例推理的信息系统总体设计[N];中国计算机报;2000年
2 中科院自动化所生物特征认证与测评中心 李江伟;知人知面 知身份[N];计算机世界;2003年
中国博士学位论文全文数据库 前10条
1 刘晓斐;冲击地压电磁辐射前兆信息的时间序列数据挖掘及群体识别体系研究[D];中国矿业大学;2008年
2 白雪;聚类分析中的相似性度量及其应用研究[D];北京交通大学;2012年
3 王文俊;基因表达数据的相似性度量和特征提取研究[D];西安电子科技大学;2011年
4 李珊珊;计算机视觉中特征与相似性度量研究[D];中国科学技术大学;2010年
5 晏实江;基于DEM的地形尺度相似性度量方法研究[D];南京师范大学;2012年
6 黎刚果;基因模块识别与分析相关问题研究[D];国防科学技术大学;2010年
7 戚文静;基于范例的图案创作关键技术研究[D];山东大学;2012年
8 韦娜;基于内容图像检索关键技术研究[D];西北大学;2006年
9 段江娇;基于模型的时间序列数据挖掘[D];复旦大学;2008年
10 董晓莉;时间序列数据挖掘相似性度量和周期模式挖掘研究[D];天津大学;2007年
中国硕士学位论文全文数据库 前10条
1 陆薛妹;面向相似性的时间序列数据挖掘研究[D];东华大学;2007年
2 周斌;基于内容的图像检索[D];南京理工大学;2004年
3 郑宇泉;时间序列挖掘方法及在投资组合中的应用[D];厦门大学;2007年
4 陈希;基于内容的图像检索技术及其应用研究[D];武汉理工大学;2008年
5 卢子奎;基于颜色与空间特征的图像检索研究[D];华侨大学;2005年
6 王芳;基于内容的图像检索技术研究[D];黑龙江大学;2005年
7 贾艳翠;基于颜色特征的图像检索技术研究[D];吉林大学;2009年
8 李朋杰;基于形状直方图的三维模型检索算法的研究[D];燕山大学;2009年
9 练仕榴;生物医学信号的相似性度量研究[D];天津理工大学;2011年
10 徐昕;文本相似性度量中参数相关性与优化配置研究[D];中南大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026