收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于统计学方法的互联网企业运营指标异常值监控及预警模型

罗荣锦  
【摘要】:随着互联网电商的兴起,越来越多的人使用互联网购物。互联网企业依托强大的计算机技术,每天会收集到庞大的用户行为数据。对于互联网企业运营团队而言,数据爆炸带来的困扰时刻影响着他们的决断。本文站在互联网企业运营团队角度,把时间序列模型和均值-极差等统计技术用于异常值检测及指标监控。不同于金融行业欺诈模型以及医学领域中的异常值甄别,本文主要关注点为企业级指标每天是否异于过去平均情况,若与过去平均状况偏差较大则自动报警提示。本文首先使用正态分布的一元离群点检验方法、非参数分析的箱形图和非监督学习的局部异常因子法对训练数据中的异常值做检测,然后运用异常值同期均值或增长率趋势进行插补,接着将配对T检验创造性地用于节假日模式识别,进而将训练数据集分成节假日和非节假日。对于非节假日数据,通过季节乘积ARIMA模型、三次指数平滑进行拟合并计算一期95%预测上下限,结合均值-极差质量监控图得出最终的预测值上下限。对于节假日数据,通过研究节假日真实数据与季节乘积ARIMA模型预测值之差所形成的序列,运用傅立叶谱分析进行拟合。最后将非节假日时期模型和节假日时期模型通过示性函数累加,得出该指标在整个时期的预测模型。若某指标当天数值超出了预测上下限则显示异常。实证分析中,本文重点分析某互联网旅游企业转化率指标。通过配对T检验得出该指标在国庆节前12天至节后6天具有明显的节假日效应,其模式为节前升高、节中降低、节后又升高的"U"型效应。通过异常点检测技术找出了 5个训练数据集中的异常点,并进行有效地插值,通过业务实践证明其插值效果和真实情况非常接近。随后建立了季节乘积ARIMA模型和三次指数平滑模型,通过样本内(外)均方误最终选用了季节乘积ARIMA模型,结合均值-极差质量监控图得到了非节假日预测模型,样本外均方误为7.78E-8。最后对国庆节影响数值研究,得到了双周期傅立叶谱分析模型。运用示性函数整合两部分得出最终的监控模型。通过实证分析和实际工作应用,异常值识别率在三个月内接近100%,有效地解决了实际工作中的现实问题。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 卞晓灵;;ARIMA模型在设备故障预测中的应用[J];科技信息(学术研究);2008年08期
2 付宇涵;;基于ARIMA模型的我国财产险保费收入的预测研究[J];统计教育;2010年10期
3 王永宏;饶继广;;基于ARIMA模型自动预测我国保险行业保费收入的应用和实践[J];软件产业与工程;2010年06期
4 陈雪娇;;我国消费者信心指数趋势分析及预测——基于ARIMA模型[J];东方企业文化;2011年10期
5 安鸿志,高洪业;TWO LIMIT THEOREMS ON ARIMA MODELS[J];Acta Mathematicae Applicatae Sinica(English Series);1988年02期
6 高洪业;IDENTIFICATION AND HYPOTHESIS TESTING ON ARIMA (p, d, q) MODELS[J];Acta Mathematicae Applicatae Sinica(English Series);1989年01期
7 孔朝莉,刘双,杨启昌;沈阳地区月平均降雨量的ARIMA时序建模与预测[J];鞍山师范学院学报;2003年06期
8 卢建昌,张世英,牛东晓;基于ARIMA的发电量预测方法[J];华北电力大学学报;2004年03期
9 陈耀辉,李楚霖;分数阶ARIMA模型的参数估计与预测[J];系统工程;2004年06期
10 石美娟;ARIMA模型在上海市全社会固定资产投资预测中的应用[J];统计教育;2004年03期
11 林恒辉;非农业库存投资的ARIMA模型[J];台声.新视角;2005年03期
12 石美娟;ARIMA模型在上海市全社会固定资产投资预测中的应用[J];数理统计与管理;2005年01期
13 梁来存;皮友静;;我国保费收入的ARIMA模型与预测[J];统计与决策;2006年07期
14 王新华;;ARIMA模型在武汉市全社会固定资产投资预测中的应用[J];统计与决策;2006年08期
15 王习涛;;ARIMA模型在期货交易预测中的应用研究[J];微计算机信息;2006年15期
16 张鸿;;ARIMA模型在广东工业指标预测中的应用[J];经济师;2006年08期
17 姜庆华;赵丽萍;;基于ARIMA模型的我国电力生产预测研究[J];价值工程;2006年09期
18 蒋燕;;ARIMA模型在广西全社会固定资产投资预测中的应用[J];数理统计与管理;2006年05期
19 白斌飞;晏正春;;ARIMA模型在移动通信用户数预测中的应用[J];统计教育;2007年05期
20 王婷;;民航客运量的ARIMA模型与预测[J];五邑大学学报(自然科学版);2007年01期
中国重要会议论文全文数据库 前10条
1 ;A hybrid ARIMA-ANN model and its Learning Algorithm on Short-term Load Forecasting[A];第二十三届中国控制会议论文集(下册)[C];2004年
2 王建锋;高歌;陈立凌;李红美;张明芝;王艾丽;;ARIMA模型及其在江苏省卫技人员数预测中的应用[A];中国现场统计研究会第12届学术年会论文集[C];2005年
3 李君华;王志坚;张立杰;陈雪;;基于小波理论及ARIMA模型的短期棉花价格预测[A];中国棉花学会2012年年会暨第八次代表大会论文汇编[C];2012年
4 陈兴荣;;ARIMA模型和GM(1,1)在我国白银消费需求预测应用中的比较研究[A];第25届全国灰色系统会议论文集[C];2014年
5 ;Double Trends Time Series Forecasting Using a Combined ARIMA and GMDH Model[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
6 刘军;柴洪洲;陈轲;刘先冬;;ARIMA模型预报电离层VTEC研究[A];第一届中国卫星导航学术年会论文集(下)[C];2010年
7 ;Economic Design of Integrating SPC and APC with Quality Constraints[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
8 任家福;张昉;周宗放;;基于ARIMA和BP神经网络的组合预测模型及应用研究[A];第三届(2008)中国管理学年会——技术与创新管理分会场论文集[C];2008年
9 ;Modeling Chronobiologic Data: An Introduction to Time Series Analysis[A];2004全国时间生物医学学术会议论文集[C];2004年
10 ;Traffic Flow Forecasting Based on Fuzzy-Neural[A];第二十六届中国控制会议论文集[C];2007年
中国硕士学位论文全文数据库 前10条
1 梁佳琦;ARIMA模型同MAXENT模型在自然保护区内口蹄疫疫情风险预警中的应用研究[D];东北林业大学;2015年
2 张海东;基于论坛的热点话题识别与趋势预测研究[D];上海师范大学;2015年
3 雍永强;基于ARIMA和BPNN的组合预测模型在血糖预测中的应用[D];郑州大学;2015年
4 张敏;基于ARIMA的组合模型问题研究[D];大连海事大学;2015年
5 桂林;退耕还林与生态环境改善的关系研究与分析[D];西安建筑科技大学;2015年
6 钱丽萍;基于ARIMA模型的儿童医院门诊量预测研究[D];苏州大学;2015年
7 于婷;基于ARIMA模型的股价的研究[D];大连海事大学;2015年
8 程浩;武汉第三产业总量时间序列研究[D];华中师范大学;2015年
9 陈天舒;基于ARIMA与GPR组合模型的人民币汇率预测[D];山东大学;2015年
10 袁磊;基于ARIMA-LSSVM混合模型的股指预测研究[D];哈尔滨工业大学;2015年
中国重要报纸全文数据库 前1条
1 ;基于数量化方法对未来经济增长趋势的预测[N];第一财经日报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978