收藏本站
《北京交通大学》 2019年
收藏 | 手机打开
二维码
手机客户端打开本文

复杂环境下时间序列预测方法研究

刘海洋  
【摘要】:时间序列数据是按时间顺序进行观测的观测值的集合,是序列数据中一类重要的数据对象,广泛存在于我们的日常生活中和科学研究领域。时间序列数据的特点包括数据量大、维度高、不断更新等。此外,时间序列数据具有数值性和连续性的特点,通常我们认为时间序列中的关键信息存在于整体变化中而非某个具体数值。时间序列数据日益广泛的使用,引发了数据挖掘领域的大量研究和开发尝试。分类和预测是数据挖掘领域的经典问题,然而由于时间序列数据的复杂性,在过去几十年间,时间序列数据分类预测已成为分类研究中的特殊挑战,诸多研究人员针对该问题进行了广泛而深入的研究。尽管在时间序列分类问题的研究上已经取得了长足的进展,在一些复杂场景下的特定算法研究还很欠缺,存在着一些待解决的问题。首先,当时间序列中具有辨别性的片段具有相位偏移时,如何准确高效的找出这些片段进行精确分类;第二,当一条时间序列存在多个类标时,如何利用多标记间的依赖关系,并建立适用于时间序列的有效的多标记分类算法;第三,当一个时间序列实例同时具有多个变量时,如何实现有效的多变量时间序列分类算法;最后,在推荐系统中,如何结合用户评分序列中的时序信息,建立推荐预测算法。本文围绕以上四种复杂环境深入研究了如何建立有效的时间序列预测算法,主要贡献如下:(1)设计了一种正规化的时间序列shapelet随机森林算法(Regularized Random Shapelet Forest,RRSF)。由于shapelet算法的固有特性,RRSF算法寻找辨别性子序列的过程与相位无关。此外,本文通过随机选取的策略加速了 shapelet的发现过程,通过集成学习方法保障了算法的预测精度,而且通过惩罚相似shapelet的方式使得随机森林中的冗余shapelet大大减少,进一步提升了算法精度和可解释性。(2)设计了一种多标记时间序列分类算法(ReliefF based Stacking,RFS)。该算法通过将标记属性加入到原有属性空间中并进行属性选择的方式,不仅定性的利用了标记间的依赖关系,而且对依赖关系进行了定量计算。进而采取时间序列符号化方法对数据进行转化,生成适用于时间序列数据的多标记分类模型。这既是对时间序列数据标记间依赖关系利用方法的深入扩展,也是多标记属性选择方法的全新应用。(3)设计了一种多变量时间序列分类算法。该算法将多变量时间序列转换为单变量时间序列数据,在保留统计特征的基础上加入和不同变量间的变化趋势特征,有效的利用了多变量间的相互关系,解决了多变量时间序列分类问题。并且,将MOOC中学生辍课预测问题视为实际应用场景,在真实MOOC数据中验证了该算法的有效性,并进行了早期预测的尝试。(4)设计并实现了一种基于评分矩阵局部低秩假设的时序协同排名算法。该算法结合了评分序列中的时序信息和排名学习技术两个领域的内容,首先我们假设评分矩阵具有局部低秩性,进而选择使用成列排名函数来优化其矩阵分解模型。上述研究成果在多种复杂环境实现了具有针对性的时间序列预测算法,展现了各个算法在预测过程的高效性,提升了时间序列预测方法的可解释性,也尝试解决了一些实际应用问题,验证了本文算法的实用性。
【学位授予单位】:北京交通大学
【学位级别】:博士
【学位授予年份】:2019
【分类号】:O211.61;TP18

手机知网App
【参考文献】
中国期刊全文数据库 前4条
1 原继东;王志海;韩萌;;基于Shapelet剪枝和覆盖的时间序列分类算法[J];软件学报;2015年09期
2 原继东;王志海;;时间序列的表示与分类算法综述[J];计算机科学;2015年03期
3 李正欣;张凤鸣;李克武;张晓丰;;一种支持DTW距离的多元时间序列索引结构[J];软件学报;2014年03期
4 冯玉才;蒋涛;李国徽;朱虹;;高效时序相似搜索技术[J];计算机学报;2009年11期
【共引文献】
中国期刊全文数据库 前10条
1 王远;陶烨;蒋英明;陈波;陈立宇;;智能电网时序大数据实时处理系统[J];计算机应用;2015年S2期
2 孙金岭;庞娟;;基于残差修正的灰色神经网络在数据挖掘中的应用[J];吉林大学学报(理学版);2015年06期
3 薛联青;刘远洪;张梦泽;王思琪;李军;;基于样本熵的降雨和径流时间序列突变检验[J];地球科学与环境学报;2015年03期
4 姚光超;郑尧;肖利民;阮利;;基于MPI+GPU的哼唱检索系统加速[J];计算机工程与科学;2013年11期
5 邹朋成;王建东;杨国庆;张霞;王丽娜;;辅助信息自动生成的时间序列距离度量学习[J];软件学报;2013年11期
6 李海林;郭崇慧;;时间序列数据挖掘中特征表示与相似性度量研究综述[J];计算机应用研究;2013年05期
7 刘端阳;张瑞强;;基于离散余弦变换的时间序列相似性检索[J];计算机系统应用;2012年09期
8 陈光平;;基于时间序列数据特性的缺失值估计算法[J];计算机工程与应用;2012年12期
9 张静静;何振峰;;基于排序的周期自动检测算法[J];计算机工程与设计;2011年12期
10 李海林;郭崇慧;;基于云模型的时间序列分段聚合近似方法[J];控制与决策;2011年10期
【二级参考文献】
中国期刊全文数据库 前6条
1 李正欣;张凤鸣;李克武;;多元时间序列模式匹配方法研究[J];控制与决策;2011年04期
2 周大镯;姜文波;李敏强;;一个高效的多变量时间序列聚类算法[J];计算机工程与应用;2010年01期
3 穆斌;闫金来;;高效的时间序列下界技术[J];计算机工程与应用;2009年11期
4 周大镯;吴晓丽;闫红灿;;一种高效的多变量时间序列相似查询算法[J];计算机应用;2008年10期
5 朱扬勇;熊赟;;DNA序列数据挖掘技术[J];软件学报;2007年11期
6 张明波,陆锋,申排伟,程昌秀;R树家族的演变和发展[J];计算机学报;2005年03期
【相似文献】
中国期刊全文数据库 前10条
1 孙其法;闫秋艳;闫欣鸣;;基于多样化top-k shapelets转换的时间序列分类方法[J];计算机应用;2017年02期
2 王金策;杨宁;;时间序列趋势预测[J];现代计算机(专业版);2017年02期
3 彭佳星;肖基毅;;基于分型转折点的证券时间序列分段表示法[J];商;2016年31期
4 刘伟龙;;基于ARMA模型的股价预测及实证研究[J];智富时代;2017年02期
5 周仰;;《漫长的告别》(年度资助摄影图书)[J];中国摄影;2017年04期
6 王嵬;;王嵬作品[J];当代油画;2017年07期
7 刘明华;张晋昕;;时间序列的异常点诊断方法[J];中国卫生统计;2011年04期
8 郭崇慧;苏木亚;;基于独立成分分析的时间序列谱聚类方法[J];系统工程理论与实践;2011年10期
9 王佳林;王斌;杨晓春;;面向不确定时间序列的分类方法[J];计算机研究与发展;2011年S3期
10 万里;廖建新;朱晓民;倪萍;;一种基于频繁模式的时间序列分类框架[J];电子与信息学报;2010年02期
中国重要会议论文全文数据库 前10条
1 周家斌;张海福;杨桂英;;多维多步时间序列预报方法及其应用[A];中国现场统计研究会第九届学术年会论文集[C];1999年
2 张可;李媛;柴毅;黄磊;;基于分段趋势的符号化时间序列聚类表示[A];第37届中国控制会议论文集(D)[C];2018年
3 张立波;庞蓉蓉;王勇;黄敏;何成涛;傅强;曲贤敏;仲昭衍;;基于时间序列的随机质控设计与应用[A];中国输血协会第九届输血大会论文专辑[C];2018年
4 徐光晶;;统计学在大地电磁测深时间序列处理中的应用[A];2017中国地球科学联合学术年会论文集(二十九)——专题57:电磁地球物理学研究及其应用[C];2017年
5 毛宇清;王咏青;王革丽;;支持向量机方法应用于理想时间序列的预测研究[A];中国气象学会2008年年会气候预测研究与预测方法分会场论文集[C];2008年
6 吴丽娜;黄领梅;沈冰;吕继强;;黄河上游降水时间序列混沌特性识别与预测年限分析[A];水系统与水资源可持续管理——第七届中国水论坛论文集[C];2009年
7 吴坚忠;路子愚;郑应平;;时间序列社会悖论模型及分析[A];1989年控制理论及其应用年会论文集(上)[C];1989年
8 雷敏;孟光;谢洪波;Kerreie Mengersen;Peter Bartlett;;嵌入维数对复杂时间序列的熵分析的影响研究[A];中国力学大会-2015论文摘要集[C];2015年
9 王兆甲;王海良;;一种相似时间序列挖掘算法及其在汽车运动分析中的应用[A];2014中国汽车工程学会年会论文集[C];2014年
10 林忠辉;莫兴国;薛玲;;用NDVI时间序列确定作物物侯和作物类型判别[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
中国重要报纸全文数据库 前10条
1 王晓宝 杨永恒 永安期货;浅析波动率的均值回复特征[N];期货日报;2017年
2 东证期货 王爱华 杨卫东;两年涨跌轮回 秋季普遍下跌[N];期货日报;2009年
3 国家统计局核算司 吕峰;不变价GDP时间序列数据的构造[N];中国信息报;2016年
4 ;《时间序列与金融数据分析》[N];中国信息报;2004年
5 何德旭 王朝阳;时间序列计量经济学:协整与有条件的异方差自回归[N];中国社会科学院院报;2003年
6 刘俏;让数据坦白真相[N];21世纪经济报道;2003年
7 卞纪;我国多时间序列湿地遥感制图完成[N];中国气象报;2011年
8 权证一级交易商 国信证券;正股走势及时间序列主导下半年权证市场运行结构[N];证券时报;2006年
9 广发期货股指研究小组 谢贞联;Hurst指数提示市场升势或将形成[N];上海证券报;2012年
10 丁睿 中粮期货研究院;试论指数HP滤波分析法的应用[N];期货日报;2014年
中国博士学位论文全文数据库 前10条
1 刘海洋;复杂环境下时间序列预测方法研究[D];北京交通大学;2019年
2 石巍巍;大规模多源时间序列预处理与隐藏空间映射分析研究[D];上海交通大学;2018年
3 康峻;基于时间序列遥感数据的植被精细分类与覆盖度反演研究[D];中国科学院大学(中国科学院遥感与数字地球研究所);2018年
4 林蕾;基于循环神经网络模型的遥感影像时间序列分类及变化检测方法研究[D];中国科学院大学(中国科学院遥感与数字地球研究所);2018年
5 丁红;柳江径流分析与预测研究[D];武汉理工大学;2016年
6 周超;集成时间序列InSAR技术的滑坡早期识别与预测研究[D];中国地质大学;2018年
7 张琪;时间序列流数据异常检测问题的研究[D];山东大学;2019年
8 张方;局部相似分析的统计研究及其在生物时间序列中的应用[D];山东大学;2019年
9 郝鹏宇;基于多时相遥感数据的作物早期识别[D];中国农业科学院;2019年
10 邹蕾;基于趋势基元的时间序列同构关系发现[D];北京科技大学;2017年
中国硕士学位论文全文数据库 前10条
1 刘彩云;基于时间序列挖掘技术的南水北调工程安全监测数据异常检测[D];华北水利水电大学;2019年
2 潘壮壮;微博热点话题表示及演化研究[D];安徽理工大学;2019年
3 武帅;面向时间序列的增量模糊聚类算法研究[D];河南理工大学;2018年
4 王赛兰;基于多元方法和时间序列的PM2.5浓度分析与预测[D];湖南师范大学;2019年
5 曹洋洋;时间序列的特征表示和相似性度量方法研究[D];江南大学;2019年
6 刘昶;基于时间序列的经典模型和LSTM模型的城市宏观行程速度预测研究[D];北京交通大学;2019年
7 朱志静;基于趋势和特征子序列的时间序列数据挖掘研究[D];江南大学;2019年
8 尹康;基于LSTM的关联时间序列预测方法研究[D];北京交通大学;2019年
9 陈洋;中高空间分辨率卫星NDVI时间序列数据重建技术研究[D];电子科技大学;2019年
10 肖宁宁;基于时间序列InSAR技术的成都地区地表沉降研究[D];电子科技大学;2019年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026