收藏本站
《华中科技大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

复杂结构的时间序列数据挖掘与预测方法研究

钱爱玲  
【摘要】:近年来,在数据挖掘领域,时间序列数据的挖掘技术取得了很大的进展。随着网络技术和无线传感器等数据感知搜集技术的不断强大,一方面,时间序列数据的结构越来越复杂,数据量的海量性也在不断地增加,另一方面,人们越来越需要从这些更为复杂的数据中发现更多的更为有用的信息和知识。与此同时,计算机的计算能力的不断强大,也对研究这些更为复杂结构的数据的特征以及挖掘发现出其中的信息和知识提供了可能。而对于诸如流式时间序列、不确定性时间序列、多时间序列等复杂结构的时间序列的数据挖掘技术还研究的不多,以往的传统的时间序列数据挖掘技术大多是对于相对简单结构的时间序列数据的挖掘。因此,对于复杂结构的时间序列数据的挖掘成为时间序列数据挖掘的新的热点问题,而结构的复杂性也使得对于复杂结构的时间序列数据挖掘技术面临着新的挑战性问题。 传感器网络中的数据是最为典型的数据流时间序列,每时每刻都在不断地产生流式数据,在短时间内有大量的数据以非常快的速度连续到达,数据量往往可能是无限大的,系统没有条件保存整个数据,这些数据随时间动态变化。针对无线传感器网络中的数据流时间序列的的复杂结构特性,主要基于节省无线传感器网络中电池能量消耗效率问题,提出了一种无线传感器网络中Top-k数据异常检测的方法PECTMA。其中,提出了4个算法,自回归持续读检测算法CRVMR,Top-k排序算法Top-k-sort,空间冗余清除算法ESR和Top-k个异常的汇集算法BRCR。总体的思想是,减少传感器节点需要传输的数据的传输量,以节省电池能源。通过与知名的可用于无线传感器网络中的异常检测的方法TA和TAG的对比实验,验证了PECTMA方法的有效性和效率。 在许多现实应用中,例如受传感器等数据采集仪器设备的精度的制约、不同粗细粒度的数据集合之间的数据转换、隐私保护等,数据的不确定性普遍存在。一方面由于时间序列数据往往存在高纬度的特性,再一方面由于不确定性数据的概率不确定性的特性,使得传统的数据管理中的数据表示、存储与索引、查询与挖掘等所有的技术,不能直接应用于不确定性时间序列数据的相似性查找。研究了可用于不确定性时间序列数据的降维表示、索引与剪枝、查找等理论与技术,针对不确定性时间序列数据结构的复杂性,首次给出了不确定性时间序列上的概率最近邻的定义;将不确定性时间序列进行PLA降维,转换到PLA空间,并提出了三个定理,用以加速查找效率;基于该三个定理,提出了不确定性时间序列数据中的概率K最近邻查找的方法PKNNU,给出了相应的查找算法PKNNS。通过实验,验证了PKNNS算法的有效性和效率。 论坛网络是一种典型的虚拟社会网络,社会网络的一些特性,如网络规模大小、存在小社会社区结构、社区关系强度、有影响力的节点、节点在社区中的稳定性等一些重要的统计量,往往正是论坛社会网络不断动态演变的外在表现,反映着论坛舆情的演进趋势情况,这些量也形成论坛网络中的多个变量的时间序列数据。结合社区结构分析和多时间序列趋势之间的关联规则分析,提出了一种论坛舆情趋势预测方法FSTP。首次对多时间序列的趋势之间的关联规则给出了定义;建立了论坛舆情预测的时间序列分析模式;FSTP方法集合了社区结构分析、时间序列预测和多时间序列的趋势之间的规则关联的挖掘,并给出了相应的FSTPM算法。在真实的和拟合的数据集上进行了实验,测试了关联规则的置信度和支持度,并与知名的算法Betweenness、External Optimization和Greedy进行了对比实验,验证了FSTPM算法的有效性和效率
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP311.13;O211.61

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 廖俊;周中良;寇英信;罗寰;;一种基于重要点的时间序列分割方法[J];计算机工程与应用;2011年24期
2 章伟;;混合模型在经济时间序列预测中的应用研究[J];计算机仿真;2011年06期
3 张雪丽;牛强;;基于角点弯曲度的时间序列相似性搜索算法[J];计算机工程;2011年15期
4 苏礼楷;;一种基于多时间粒度的实时客流查询优化算法[J];计算机与现代化;2011年08期
5 周庆兰;陈然;周鹏;;时间序列相似性度量的面积距离方法的研究[J];软件导刊;2011年06期
6 王少军;刘琦;彭宇;彭喜元;;CLS-SVM:一种时间序列预测的局部建模方法[J];仪器仪表学报;2011年08期
7 周勇;李念水;程春田;;时间序列数据流预测模型应用研究[J];计算机工程与应用;2011年26期
8 辛婷婷;刘国华;;K-匿名隐私保护模型下的Top-k查询[J];计算机科学与探索;2011年08期
9 刘皓挺;李凡;徐凤刚;卢汉清;;利用图像质量评估空气质量的新方法[J];中国图象图形学报;2011年06期
10 薄洪光;张书冉;刘晓冰;张楠;刘健;;支持钢铁企业产能时序预测的数据同化方法[J];计算机集成制造系统;2011年06期
中国重要会议论文全文数据库 前10条
1 张冬冬;李建中;王伟平;郭龙江;;时间序列数据流上历史数据的聚集算法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
2 赵亮;臧秀娟;;黔川桂三省三大需求与经济增长关系的比较研究——基于对三省1990~2009年时间序列数据的检验[A];西部省区市社科联第四次协作会议暨西部发展能力建设论坛论文集[C];2011年
3 武宏文;李世平;;陕西省建设占用耕地与经济基本面的关系研究[A];2006年中国土地学会学术年会论文集[C];2006年
4 徐俊武;卢现祥;;公共支出、政府治理、部门效应与共享式增长——基于中国时间序列数据的分析[A];第十一届中国制度经济学年会论文汇编(上)[C];2011年
5 邬文帅;寇纲;;城市环境治理能力评估:一种基于熵权的动态组合评价方法[A];经济全球化与系统工程——中国系统工程学会第16届学术年会论文集[C];2010年
6 覃秋梅;范礼林;;一种新的不确定性推理模型[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(下册)[C];2002年
7 张素兰;张继福;;融合粗集和概念格理论的分类知识挖掘模型研究[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
8 吴俊杰;信俊昌;王国仁;周诗咏;;k支配能力排序轮廓查询算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 柯木飞;尹昌斌;;低碳经济发展的路径选择与对策建议[A];2010中国可持续发展论坛2010年专刊(一)[C];2010年
10 艾文凯;张剡;柏文阳;;基于用户偏好的不确定数据阈值轮廓查询算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
中国重要报纸全文数据库 前10条
1 记者 宋焱;外汇局发布外汇统计时间序列数据[N];金融时报;2009年
2 王剑辉;大小周期 不可不察[N];上海证券报;2011年
3 北京兆泰投资顾问有限公司CIA研究中心;2008年CIA《经营分析和信息技术》试题解析[N];中国审计报;2009年
4 中金公司 哈继铭;谁说中国人不消费[N];证券时报;2009年
5 冯兴元;论农民权益保护[N];中国经济时报;2003年
6 张涛;三农问题:现象与根源[N];中华工商时报;2002年
7 平安证券 郭艳红 李先明;预测公司增长率的方法及局限性[N];中国证券报;2009年
8 本报记者 潘永花;Informix 数据库支撑空间地理应用[N];网络世界;2001年
9 记者 杨振宇;美国Isilon公司推出新数据存储软件[N];中国石油报;2010年
10 清华大学经济管理学院 高建;中国的科技起飞[N];科技日报;2003年
中国博士学位论文全文数据库 前10条
1 钱爱玲;复杂结构的时间序列数据挖掘与预测方法研究[D];华中科技大学;2011年
2 吴少智;时间序列数据挖掘在生物医学中的应用研究[D];电子科技大学;2010年
3 陈红梅;不确定性数据的分类研究[D];云南大学;2012年
4 陈钊;时间序列数据与稳健建模的统计新方法研究[D];中国科学技术大学;2012年
5 许华杰;无线传感器监测网络环境不确定性数据处理研究[D];华中科技大学;2008年
6 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
7 张天成;实时数据流相关性分析与挖掘技术研究[D];东北大学;2008年
8 罗强;生物系统建模中的网络重构方法[D];国防科学技术大学;2010年
9 黎治华;基于MODIS反演重构时间序列数据的长江三角洲地区生态环境演变研究[D];华东师范大学;2011年
10 高明;不确定数据的世系管理和相似性查询[D];复旦大学;2011年
中国硕士学位论文全文数据库 前10条
1 张伟;不确定性数据中图模型的构建[D];云南大学;2012年
2 梁达鹏;基于元组聚类特征的不确定性数据流聚类算法研究[D];燕山大学;2010年
3 张科;代谢组学时间序列数据趋势分析方法研究[D];大连理工大学;2012年
4 李岩;基于稀疏贝叶斯学习的不确定性数据处理方法研究[D];武汉理工大学;2011年
5 岳德君;时间序列数据流中相关性分析技术的研究[D];东北大学;2008年
6 李念水;时间序列数据流在线预测研究与应用[D];大连理工大学;2010年
7 孙平平;不确定数据库中的高效检索策略研究[D];山东师范大学;2012年
8 郭利锐;海洋台站不确定性数据管理技术的研究[D];上海海洋大学;2012年
9 刘光熠;关于不确定性数据置信度算法的研究[D];复旦大学;2010年
10 任芳;时间序列数据挖掘研究[D];辽宁师范大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026