收藏本站
《太原理工大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于并行随机森林的城市PM_(2.5)浓度预测

任才溶  
【摘要】:随着我国经济的快速发展,人类的物质文化生活水平不断提升,但是环境与发展的不协调也日益突显出来。环境在人类社会发展的过程中受到了巨大的破坏,主要表现在人类、动植物赖以生存的空气、水、土壤等。近些年来,空气质量污染问题频频出现,雾霾等大气污染不仅对人类的正常生产、生活、工作及学习等方面带来负面影响,同时也无形之间对人们的身心健康造成了危害,更是阻碍了社会的可持续发展。PM_(2.5)作为雾霾形成的元凶,对其进行科学有效地预测可以让人们提前做好防护工作,尽最大限度的减少对人体的危害。太原市作为我国典型的能源化工城市,空气污染问题已持续很久,因此研究太原市PM_(2.5)浓度预测已成为具有十分现实意义的课题。本文主要从以下几个方面对太原市PM_(2.5)浓度预测进行了研究:首先,本文以太原市2013年1月1日至2017年12月31日的空气质量监测数据和同时期的地面气象数据为基础,对其进行数据挖掘。对PM_(2.5)浓度从月、周、日等多个时间尺度的变化规律进行分析;也将PM_(2.5)浓度与其他空气污染物(如PM_(10)、SO_2、NO_2、CO、O_3)之间的相关性进行分析;此外,还分析了大气中气象条件(如温度、湿度、风向、风速等)对PM_(2.5)浓度扩散的影响;最后,还对预测站点与周边站点PM_(2.5)浓度的时空关联性进行了分析研究。其次,在数据预处理环节,利用K-Means算法将气象数据聚类,对不同的聚类簇建立不同的预测模型;使用随机森林算法利用污染物之间的相关性建立填补PM_(2.5)缺失值的模型,对PM_(2.5)缺失值进行了填补;最后从数据层面出发,使用欠采样算法减少或消除类不平衡对预测模型带来的负面影响。最后,利用随机森林算法并基于Spark平台建立PM_(2.5)浓度值预测模型和PM_(2.5)浓度等级预测模型。以时间因子、气象条件、站点关联性为特征进行模型构建,并对所建立的模型预测结果进行了评价,结果表明,本文所提出的预测方法对太原市PM_(2.5)浓度有较高的预测精度。
【学位授予单位】:太原理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:X513

【参考文献】
中国期刊全文数据库 前10条
1 石礼娟;卢军;;基于随机森林的玉米发育程度自动测量方法[J];农业机械学报;2017年01期
2 李磊;牟少敏;林中琦;;随机森林在棉蚜虫害等级预测中的应用[J];安徽农学通报;2017年01期
3 姜隽;;太原市空气环境质量综合分析报告[J];山西科技;2016年05期
4 姚达文;刘永红;丁卉;黄晶;詹鹃铭;徐伟嘉;;气象参数对基于BP神经网络的PM_(2.5)日均值预报模型的影响[J];安全与环境学报;2015年06期
5 朱亚杰;李琦;侯俊雄;冯逍;范竣翔;;基于支持向量回归的PM_(2.5)浓度实时预报[J];测绘科学;2016年01期
6 余辉;袁晶;于旭耀;张力新;陈文亮;;基于ARMAX的PM_(2.5)小时浓度跟踪预测模型[J];天津大学学报(自然科学与工程技术版);2017年01期
7 沈劲;钟流举;何芳芳;陈多宏;;基于聚类与多元回归的空气质量预报模型开发[J];环境科学与技术;2015年02期
8 陶双成;邓顺熙;刘宁;李彦鹏;;机动车排放对城市光化学烟雾形成的影响[J];世界科技研究与发展;2015年01期
9 尹华;胡玉平;;基于随机森林的不平衡特征选择算法[J];中山大学学报(自然科学版);2014年05期
10 ;伦敦烟雾事件[J];世界环境;2014年01期
中国重要会议论文全文数据库 前1条
1 赵艳霞;侯青;;近13年(1993-2005)中国区域酸雨变化特征[A];中国气象学会2006年年会“大气成分与气候、环境变化”分会场论文集[C];2006年
中国硕士学位论文全文数据库 前3条
1 李创权;肾小球基底膜TEM图像分割方法的研究[D];南方医科大学;2017年
2 郭佳;基于随机森林的遥感干旱监测模型及其应用研究[D];南京信息工程大学;2016年
3 巫晓杰;基于并行随机森林的在线贷款逾期预测研究[D];华南理工大学;2016年
【共引文献】
中国期刊全文数据库 前10条
1 蔡子颖;张敏;韩素芹;李培彦;刘敬乐;姚青;;天津重污染天气混合层厚度阈值及应用研究[J];气象;2018年07期
2 侯俊雄;李琦;林绍福;冯逍;朱亚杰;;门限重复单元的PM2.5浓度预报方法[J];测绘科学;2018年07期
3 韩伟;吴艳兰;任福;;基于全连接和LSTM神经网络的空气污染物预测[J];地理信息世界;2018年03期
4 何红弟;赵积强;程丽军;刑小虎;;上海市夏季高架道路边颗粒物垂直分布研究[J];安全与环境学报;2018年03期
5 杭琦;杨敬辉;黄国荣;;随机森林算法在空气质量评评价中的应用[J];上海第二工业大学学报;2018年02期
6 吴帅;赵方;;基于随机森林的老年人居住偏好预测研究[J];计算机工程与科学;2018年05期
7 林开春;邵峰晶;;基于随机森林和神经网络的空气质量预测研究[J];青岛大学学报(工程技术版);2018年02期
8 李旭阳;邵峰晶;;LSTM与随机森林购买行为预测模型研究[J];青岛大学学报(工程技术版);2018年02期
9 潘登;郁培义;吴强;;基于气象因子的随机森林算法在湘中丘陵区林火预测中的应用[J];西北林学院学报;2018年03期
10 赵小强;张露;;基于SVM的高维不平衡数据集分类算法[J];南京大学学报(自然科学);2018年02期
中国硕士学位论文全文数据库 前2条
1 任才溶;基于并行随机森林的城市PM_(2.5)浓度预测[D];太原理工大学;2018年
2 周杰;Spark平台下的基于随机森林算法的用户贷款风险预测研究[D];东北师范大学;2018年
【二级参考文献】
中国期刊全文数据库 前10条
1 顾海燕;闫利;李海涛;贾莹;;基于随机森林的地理要素面向对象自动解译方法[J];武汉大学学报(信息科学版);2016年02期
2 赵庆展;刘伟;尹小君;张天毅;;基于无人机多光谱影像特征的最佳波段组合研究[J];农业机械学报;2016年03期
3 梁琨;杜莹莹;卢伟;王策;徐剑宏;沈明霞;;基于高光谱成像技术的小麦籽粒赤霉病识别[J];农业机械学报;2016年02期
4 刘哲;李智晓;张延宽;张超;黄健熙;朱德海;;基于时序EVI决策树分类与高分纹理的制种玉米识别[J];农业机械学报;2015年10期
5 陈冠益;张雯;侯立安;杨会军;颜蓓蓓;佟玲;孙颖;;天津蓟县夏季PM_(2.5)污染特征及影响因素[J];天津大学学报(自然科学与工程技术版);2015年02期
6 周金辉;马钦;朱德海;郭浩;王越;张晓东;李绍明;刘哲;;基于机器视觉的玉米果穗产量组分性状测量方法[J];农业工程学报;2015年03期
7 郑冬;李丹;纪德钰;徐洁;侯宝荟;刘顺;;大连市区近地面臭氧污染规律研究及与PM_(2.5)等污染物的相关性分析[J];环境与可持续发展;2014年06期
8 魏薇;傅丽芳;;基于改进高斯模型的哈尔滨市PM_(2.5)扩散问题实证分析[J];数学的实践与认识;2014年22期
9 蔡加欣;冯国灿;汤鑫;罗志宏;;基于局部轮廓和随机森林的人体行为识别[J];光学学报;2014年10期
10 王传宇;郭新宇;吴升;肖伯祥;杜建军;;基于计算机视觉的玉米果穗三维重建方法[J];农业机械学报;2014年09期
中国硕士学位论文全文数据库 前7条
1 李穆;肾小球TEM病理图像的大视野拼接及基底膜分割[D];南方医科大学;2016年
2 吴建峰;基于TRMM和MODIS卫星数据的重庆市干旱监测模型构建[D];重庆师范大学;2015年
3 李艳利;基于气象数据和LST-NDVI特征空间的吉林省干旱时空分析[D];东北师范大学;2015年
4 杨恒;基于数据重建的江西省生态环境变化遥感分析[D];南京信息工程大学;2014年
5 周轩;基于数据挖掘技术的商业银行个人信用评分模型研究[D];湖南大学;2014年
6 庄少伟;基于标准化降水蒸发指数的中国区域干旱化特征分析[D];兰州大学;2013年
7 陈继祖;河南省区域干旱灾害风险评估[D];郑州大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 陈一诺;董绍华;;基于随机森林算法的管道缺陷预测方法[J];油气储运;年期
2 刘阳;杜华军;岳子涵;马杰;吕武;;基于随机森林的无人机检测方法[J];计算机工程与应用;年期
3 胡蝶;;基于随机森林的债券违约分析[J];当代经济;2018年03期
4 温博文;董文瀚;解武杰;马骏;;基于改进网格搜索算法的随机森林参数优化[J];计算机工程与应用;2018年10期
5 赵艺淞;杨昆;王保云;黎晓路;;随机森林在城市不透水面提取中的应用研究[J];云南师范大学学报(自然科学版);2017年03期
6 吴辰文;梁靖涵;王伟;李长生;;一种顺序响应的随机森林:变量预测和选择[J];小型微型计算机系统;2017年08期
7 顾娟;林敏;鞠桂玲;;基于随机森林回归的军械器材需求预测[J];自动化应用;2017年09期
8 刘迎春;陈梅玲;;流式大数据下随机森林方法及应用[J];西北工业大学学报;2015年06期
9 罗超;;面向高维数据的随机森林算法优化探讨[J];商;2016年04期
10 杨晓峰;严建峰;刘晓升;杨璐;;深度随机森林在离网预测中的应用[J];计算机科学;2016年06期
中国重要会议论文全文数据库 前10条
1 尤东方;赵杨;;存在混杂时高维数据的随机森林分析[A];2017年中国卫生统计学学术年会论文集[C];2017年
2 张涛;李贞子;武晓岩;李康;;随机森林回归分析方法及在代谢组学中的应用[A];2011年中国卫生统计学年会会议论文集[C];2011年
3 吕洁;;基于随机森林算法对内蒙古地区地面逐日平均温度的估算[A];第34届中国气象学会年会 S20 气象数据:深度应用和标准化论文集[C];2017年
4 张炜;;天津市人才吸引力影响要素评价——基于随机森林法的检验分析[A];发挥社会科学作用 促进天津改革发展——天津市社会科学界第十二届学术年会优秀论文集(中)[C];2017年
5 高洪利;;基于随机森林算法的卷烟销量预测及分析[A];中国烟草学会学术年会优秀论文集[C];2017年
6 武晓岩;方庆伟;;基因表达数据分析的随机森林方法及算法改进[A];黑龙江省第十次统计科学讨论会论文集[C];2008年
7 高磊;秦慧杰;许康;;基于随机森林的资源三号影像地表覆盖信息提取[A];地理信息与人工智能论坛暨江苏省测绘地理信息学会2017年学术年会论文集[C];2017年
8 郑志伟;邱佳玲;阳庆玲;龚晓春;郭山清;贾忠伟;郝春;;随机森林算法对文本情感分析的应用与R软件实现[A];2017年中国卫生统计学学术年会论文集[C];2017年
9 杨璐;宋建国;;基于随机森林的地震储层分类方法研究[A];2017中国地球科学联合学术年会论文集(三十八)——专题71:内磁层动力学、专题72:计算地球物理方法和技术、专题73:地热:“学”以致“用”、专题74:电磁卫星观测与应用[C];2017年
10 刘继辉;许磊;马晓龙;李达;林鸿佳;杨洋;杨晶津;李兴绪;王慧;;基于随机森林回归的制丝过程参数影响权重分析[A];中国烟草学会学术年会优秀论文集[C];2017年
中国重要报纸全文数据库 前1条
1 本报记者 田新元;人工智能助力保险业智慧化转型[N];中国改革报;2017年
中国博士学位论文全文数据库 前10条
1 王晓军;基于大数据的风洞马赫数集成建模方法的研究[D];东北大学;2016年
2 王鑫;基于随机森林的认知网络频谱感知算法研究[D];东北大学;2016年
3 姚登举;面向医学数据的随机森林特征选择及分类方法研究[D];哈尔滨工程大学;2016年
4 黄玥;VANET信息安全问题及异常检测技术研究[D];吉林大学;2017年
5 倪强;基于随机前沿和随机森林法的沿海开发区发展效率研究[D];天津大学;2011年
6 季斌;内蒙古浩布高地区多金属矿综合信息找矿预测研究[D];合肥工业大学;2017年
7 雷震;随机森林及其在遥感影像处理中应用研究[D];上海交通大学;2012年
8 金超;基于随机森林的医学影像分割算法研究及应用[D];苏州大学;2017年
9 李宝富;巨厚砾岩层下回采巷道底板冲击地压诱发机理研究[D];河南理工大学;2014年
10 赵东;基于群智能优化的机器学习方法研究及应用[D];吉林大学;2017年
中国硕士学位论文全文数据库 前10条
1 叶蓓;WorldView-3数据的岩性信息自动提取方法研究[D];中国地质大学(北京);2018年
2 高聪;基于随机森林的不平衡大数据分类算法研究[D];东北电力大学;2018年
3 闫东阳;基于对象的随机森林遥感分类方法优化[D];中国地质大学(北京);2018年
4 吴卫星;随机森林在技术指标量化选股中的应用[D];电子科技大学;2018年
5 张向前;机器学习在辐射源信号指纹识别中的应用研究[D];电子科技大学;2018年
6 王梦芹;基于随机森林的个人信用评价指标分析[D];安徽大学;2018年
7 谈小雨;基于情感时序距离的文本情感分类和情感主体识别方法研究[D];安徽大学;2018年
8 苏靖宇;多因子选股模型在A股市场上的实证研究[D];安徽大学;2018年
9 刘建航;大数据环境下异常通话行为检测的研究[D];北京邮电大学;2018年
10 罗斌杰;基于随机森林的心脏病预测平台的设计与实现[D];北京邮电大学;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026