收藏本站
收藏 | 论文排版

基于机器学习混合模型的用电数据异常检测研究

肖端翔  
【摘要】:随着科技的发展进步与电力体制的改革,人们的用电需求呈不断上升的趋势。同时,互联网行业的兴起以及社会经济的发展,也对电力消耗的持续增长提供了有力的支撑.近年来,大规模的窃电事件时有发生,并且其态势已经从最初的直接粗暴发展为设备智能化、手段专业化、行为隐蔽化、实施规模化的高科技窃电。窃电行为的发生,不仅给电力公司及合法用户带来巨额的经济损失,更对电网造成了不同程度的破坏。在智能电网的建设过程当中,如何对潜在的异常数据进行及时准确的检测,有效地甄别窃电行为,是保障电网安全性和高可靠性的关键。对于上述背景,本文的研究工作主要围绕以下几个方面展开:1.本文首先对当下智能电网的数据流程及存在的窃电现象进行总结,并对近年来国内外关于窃电检测的研究进展进行了梳理。基于各种方法的比较,结合真实的电网异常用电数据集,将全体电力用户划分为长时间跨度用户和短时间跨度两类,并制定合理的数据预处理和特征提取流程,最终生成与类别标签具有较强关联性的特征集合.2.对于存在长时间跨度用电记录的检测对象,本文根据此类用户最近两年的用电行为特征,采用基于XGBoost、Random Forest和Logistics Regression的混合算法,综合考量三个分类模型的预测结果,对用户的用电行为正常与否给出最终判断。此混合模型的出发点在于,不同的子模型对于不同数据的敏感程度及处理能力各有所长,通过结合每一个子模型的判别结果,得到一个较为全面的综合模型。经过实验验证及最近同类研究对比,这一混合检测模型在各评价指标上的表现均十分优秀,能够较好地完成此类用户异常与否的甄别任务。3.针对仅存在较短时间跨度用电记录的检测对象(开户时间较近的对象),选取此类用户当月的用电记录生成的特征,在One-Class SVM的异常点划分基础上,根据Local Outlier Factor的密度衡量及LSTM预测的正常用户用电均值对One-Class SVM结果中被错判的正常用户进行修正调整.目前,关于短时间跨度的用电数据异常检测研究相对缺乏,本文的设计方案具备一定的创新性与合理性。经过实际数据的检验,这一策略在保留One-Class SVM高召回率特点的同时,也使整体判断的准确率有较为明显的提升。4.在整个模型的训练过程中,对于参数较复杂的算法子模块,本文采用贝叶斯优化的方法,获取该模块在训练数据下的超参数。这一过程相比于传统的随机搜索、网格搜索,在迭代过程中参考之前的参数信息,不断地更新先验,迭代次数相对较少,针对非凸问题依然有良好的效果。通过实验验证,贝叶斯优化既将计算耗时限定在合理的范围内,同时保证了最终所得超参数的质量。本文所设计的基于机器学习混合模型的用电数据异常检测方案,能够基于电力用户的统计数据进行科学准确的判断分类,为降低供电企业运维成本、排除潜在的电力系统隐患提供了有效的技术支持。


知网文化
【相似文献】
中国期刊全文数据库 前17条
1 周彤彤;俞凯;袁贞明;卢莎;胡文胜;;基于LSTM与XGBOOST混合模型的孕妇产后出血预测[J];计算机系统应用;2020年03期
2 吴刚;;基于数据内在特性和LSTM的用电数据异常检测算法研究[J];无线互联科技;2019年10期
3 赵水忠;王剑;顾晔;;利用机器学习RFID混合模型的运维检修移动作业应用[J];现代电子技术;2020年09期
4 林越;刘廷章;唐侃;;基于自适应模糊聚类与核主元分析混合模型的变压器异常检测[J];科技通报;2020年09期
5 周亚同;陈子一;马尽文;;从高斯过程到高斯过程混合模型:研究与展望[J];信号处理;2016年08期
6 温粉莲;;一种混合模型的时序数据异常检测方法[J];数字通信世界;2020年01期
7 吕月坪;;一种基于六维打分的混合模型业务推荐系统[J];福建电脑;2017年03期
8 戴妙林;郭震;秦俊德;;位移混合模型的改进[J];河海大学学报;1992年06期
9 陈莹旭;;中国古画矿物颜料光谱混合模型——以石青和石绿为例[J];文物鉴定与鉴赏;2020年19期
10 谢丽莉;李振彰;刘朝辉;陈镇坤;;基于贝叶斯分层混合模型的X线胸片图像病例分析[J];医疗装备;2020年05期
11 包振华;宋晓琳;;广义指数-帕累托(Ⅳ)混合模型[J];辽宁师范大学学报(自然科学版);2018年01期
12 潘迪夫;陈军;鲍天哲;韩锟;;多输出支持向量机混合模型在机车调簧中的应用[J];华南理工大学学报(自然科学版);2018年04期
13 吴阳;潘静;何宇清;谢英红;;基于概率分布混合模型的遮挡行人检测算法[J];信息技术;2017年01期
14 赵海心;徐胜利;王正华;王博;陈钢;;实-壳混合模型温度场计算方法研究"[J];热力透平;2017年03期
15 邓锐;陈左宁;;基于可信计算的群内安全信息共享混合模型[J];上海交通大学学报;2014年07期
16 刘哲;宋余庆;;基于抽样的正交多项式混合模型图像分割[J];小型微型计算机系统;2013年06期
17 杨清云;;房地产电子商务交易中的“混合模型”[J];现代商业;2008年23期
中国重要会议论文全文数据库 前20条
1 张展;赵英;陈骏君;刘淑梅;;基于CNN和RNN混合模型的入侵检测[A];中国计算机用户协会网络应用分会2020年第二十四届网络新技术与应用年会论文集[C];2020年
2 纪琳;张振京;陈艳;;中频混合模型简化计算的数例研究[A];第25届全国振动与噪声高技术及应用会议论文选集[C];2012年
3 兰永红;吴敏;佘锦华;;基于二维混合模型的最优重复控制[A];第二十六届中国控制会议论文集[C];2007年
4 顾琰浩;吴晓东;李明军;;面向增程式混合动力车辆的发动机混合模型设计[A];2019中国汽车工程学会年会论文集(2)[C];2019年
5 张隆辉;魏纳新;匡晓峰;范亚丽;;系泊系统主动式截断混合模型试验技术数值仿真[A];聚焦应用 支撑创新——船舶力学学术委员会测试技术学组2016年学术会议论文集[C];2016年
6 卫颖奇;彭进业;;一种基于混合模型的特征提取方法[A];第三届全国嵌入式技术和信息处理联合学术会议论文集[C];2009年
7 Jonny Bentwood;;营销中的AI应用与未来发展[A];清研智库系列研究报告(2020年第5期)[C];2020年
8 陈一;吴笛;段俐;康琦;;机器学习在BM对流研究中的应用[A];第十一届全国流体力学学术会议论文摘要集[C];2020年
9 骆新斗;郭昊;刘沛清;;基于机器学习对低雷诺数下平板转捩模拟修正[A];第十一届全国流体力学学术会议论文摘要集[C];2020年
10 ;科技民生报告丛书——无人胜有人——聚焦无人平台的发展与应用 第五章 未来的无人之境 第二节 人工智能助力无人平台“跨越险阻”[A];科技民生报告丛书——无人胜有人——聚焦无人平台的发展与应用[C];2019年
11 钟昊;宗孝鹏;;图像情报处理中的小样本机器学习应用研究[A];2019第七届中国指挥控制大会论文集[C];2019年
12 王红睿;;机器学习背景下的太阳辐射数据基本重构方法[A];中国天文学会2018年学术年会摘要集[C];2018年
13 王晓春;高芳;;基于机器学习和大数据的智能化故障预警系统[A];2017-2019年“学术金秋”获奖论文集[C];2020年
14 殷昌盛;杨若鹏;邹小飞;鲁义威;宋笑雨;;指挥智能化研究综述[A];第八届中国指挥控制大会论文集[C];2020年
15 岳玲;肖世富;;基于机器学习对主观认知下降的7年随访预测研究[A];2019全国老年痴呆与认知障碍相关疾病学术大会论文摘要[C];2019年
16 王珏;;归纳机器学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年
17 王衍鲁;张利会;张淑洁;石洁茹;王鹏;;大学新生学校适应的个体与环境因素探究:基于机器学习的考察[A];第二十届全国心理学学术会议--心理学与国民心理健康摘要集[C];2017年
18 张长水;;大数据机器学习[A];2015年中国自动化大会摘要集[C];2015年
19 何琳;侯汉清;;基于标引经验和机器学习相结合的多层自动分类[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
20 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
中国博士学位论文全文数据库 前20条
1 ;[D];;年
2 凌晓亮;混合模型中的随机比较[D];兰州大学;2013年
3 李炜;多种混合模型下的盲信号分离方法研究[D];江南大学;2014年
4 聂伟;不同混合模型下非平稳信号的分离与提取[D];哈尔滨工程大学;2017年
5 彭伟才;基于混合模型的中频振动声学分析[D];华中科技大学;2010年
6 熊太松;基于统计混合模型的图像分割方法研究[D];电子科技大学;2013年
7 兰永红;基于二维模型的重复控制系统分析与设计[D];中南大学;2010年
8 ;[D];;年
9 ;[D];;年
10 ;[D];;年
11 ;[D];;年
12 ;[D];;年
13 ;[D];;年
14 ;[D];;年
15 ;[D];;年
16 王磊;基于机器学习的药物—靶标相互作用预测研究[D];中国矿业大学;2018年
17 张庆;钙钛矿型功能材料的基因组工程研究[D];上海大学;2018年
18 管月;医学肿瘤影像分类算法研究及其在肝癌上的应用[D];南京大学;2018年
19 郝小可;基于机器学习的影像遗传学分析及其应用研究[D];南京航空航天大学;2017年
20 施建明;基于机器学习的产品剩余寿命预测方法研究[D];中国科学院大学(中国科学院遥感与数字地球研究所);2018年
中国硕士学位论文全文数据库 前20条
1 肖端翔;基于机器学习混合模型的用电数据异常检测研究[D];华中师范大学;2020年
2 郭元凯;基于XGBoost的混合模型在股票预测中的应用研究[D];兰州理工大学;2020年
3 郭元凯;基于XGBoost的混合模型在股票预测中的应用研究[D];兰州理工大学;2020年
4 李瑞环;混合深度学习模型在刑事案例中刑期预测的方法研究[D];湖南大学;2019年
5 王心怡;指数幂混合模型的估计及其在VaR上的应用[D];厦门大学;2019年
6 何旭;一元混合模型中的相对随机序[D];石河子大学;2020年
7 吕珊珊;一类多维变量密度的Bernstein多项式混合模型估计[D];哈尔滨师范大学;2019年
8 梁玉钊;基于混合模型的落叶松人工林树皮厚度及树皮因子研究[D];东北林业大学;2019年
9 田晓丹;基于LSTM与多GARCH型混合模型的股价波动性预测的实证分析[D];哈尔滨工业大学;2019年
10 梁莹;地下水位监测值缺失修复混合模型研究[D];南京师范大学;2019年
11 栾桂凯;基于参数估计的张量分解研究[D];云南大学;2019年
12 庞敏;基于LSTM混合模型的时间序列预测[D];华中科技大学;2019年
13 王鹭轩;基于混合模型的股指期货研究与预测[D];大连理工大学;2019年
14 袁博;基于粒子混合模型的固-液-气三相动态模拟[D];华中科技大学;2019年
15 李毓瑞;基于混合模型的POI表示学习[D];云南大学;2019年
16 袁敏;基于正态混合模型的贝叶斯分类方法及其应用[D];武汉大学;2017年
17 高宁;非高斯统计模型的变分学习算法及其应用研究[D];北方工业大学;2019年
18 宋莉;基于混合模型的中文微博情感分析[D];厦门大学;2017年
19 韩峰;基于混合模型的时间序列预测方法研究[D];天津理工大学;2019年
20 赵明明;基于混合模型方法的PM2.5浓度的预测[D];兰州大学;2019年
中国重要报纸全文数据库 前20条
1 Julie Battilana,Matthew Lee,John Walker & Cheryl Dorsey 翻译 谭立立;营利与非营利组织的理想混合模型(上篇)[N];21世纪经济报道;2012年
2 Julie Battilana Matthew Lee John Walker Cheryl Dorsey 翻译 谭立立;营利与非营利组织的理想混合模型(下篇)[N];21世纪经济报道;2012年
3 杜铭;国家能源局发布9月份社会用电数据[N];国家电网报;2009年
4 记者 王文嫣;4月用电数据印证经济压力大[N];上海证券报;2014年
5 本报记者 李欣忆;每天约3亿条用电数据“画”出四川复工复产态势图[N];四川日报;2020年
6 本报记者 彭源长;“GDP和用电数据不匹配”是错觉[N];中国电力报;2015年
7 彭源长;用电数据显示经济向好[N];中国电力报;2013年
8 本报记者 彭源长;首季用电数据稳中有变[N];中国电力报;2014年
9 本报记者 范思立;上半年用电数据凸显了什么[N];中国经济时报;2010年
10 本报记者 彭源长;用电数据显示经济稳中向好[N];中国电力报;2013年
11 采访人 本报记者 卢健;“中间三天”问题 最对机器学习“胃口”[N];中国气象报;2020年
12 ;你也可以体验的机器学习[N];电脑报;2020年
13 骆无意;机器学习可改变人类探测太空方式[N];中国航天报;2020年
14 记者 张梦然;机器学习诞生新型“研究员”[N];科技日报;2020年
15 记者 刘霞;机器学习发现数百种潜在新冠药物[N];科技日报;2020年
16 InfoWorld网站特约编辑兼评论员 Martin Heller 编译 陈琳华;如何选择云机器学习平台[N];计算机世界;2020年
17 CIO.com一名资深撰稿人 Clint Boulton 编译 沈建苗;机器学习的5个成功案例[N];计算机世界;2020年
18 CIO.com资深作家 Clint Boulton 编译 Charles;领先一步:机器学习的10个成功案例[N];计算机世界;2018年
19 Bob Violino 编译 Charles;盲目冒进:机器学习的5个失败案例[N];计算机世界;2018年
20 本报驻波士顿记者 侯丽;深入挖掘机器学习潜力[N];中国社会科学报;2019年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978