基于SVM的客户流失预测研究
【摘要】:客户流失问题是目前移动通信行业普遍存在的最为关注的问题之一,流失预测则是解决此问题的前提。本论文基于云南移动经营分析系统平台,结合云南移动本身的业务需求,分析相关数据挖掘理论及客户流失预测算法,抽取一定的云南移动客户流失数据作为样本数据,采用常见数据挖掘过程模型,用支持向量机,神经网络等算法构建客户流失预测模型。通过理论分析与实验结果比较,证明基于非平衡核向量机算法的客户流失预测模型更适合处理移动客户流失预测问题。
客户流失预测模型的建模过程分为业务问题定义、数据选择、数据准备、数据分析、模型建立与模型结果相关指标对比分析。而模型发布和实施组成等环节,由于不是本文的重点,故没有详细涉及。
本文首先介绍了目前客户流失预测的必要性及意义,从理论角度分析对比常用的预测模型算法优缺点,并在经营分析系统的基础上,分析了移动客户流失问题的特征。在统计学习理论基础上,分析了支持向量机基础理论和分类原理,把目前在客户流失预测领域中较少使用的非平衡核向量机应用到移动客户流失预测问题中。其次根据客户流失问题相关定义,结合领域工程师经验和数据挖掘知识对云南移动数据进行采样,噪声处理,并对采样数据的连续变量与离散变量进行分析,确定了样本集中的最终变量。在实验中,指出了本文实验过程及方法,搭建了基于LIBSVM和WEKA的两个实验平台,分别生成了非平衡核向量机(ICSVM)模型和神经网络(BP),决策树(C4.5),贝叶斯(NB)三个对比模型,并介绍了不同平台的所需的数据格式及调用方法,说明了结果处理的方法。最后在实验结果部分设计了离网率,精确度,训练时长及正分率几个评价指标,对ICSVM模型其它性能也作了分析,从理论和实验角度证明了基于ICSVM的模型适合处理移动客户流失预测问题。