收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于Stacking的P2P贷款违约预测模型构建及应用

王竟羽  
【摘要】:近年来互联网金融与大数据技术的发展使得传统金融机构的中介作用下降,互联网金融理财观念日渐深入人心,大众逐渐把P2P网络借贷作为金融消费理财的重要途径。国内P2P网贷行业因此迅速发展,但是在快速发展的背后伴随的问题与风险也在逐步提高,2018年我国P2P网贷平台出现集中爆雷潮,发生了大面积的客户违约现象,高坏账率导致大量平台出现资金提现困难、倒闭等现象,因此如何准确识别潜在违约客户,降低信用违约风险变成迫在眉睫的问题,只有将借款客户的信用违约问题处理好,才能够更好的促进我国P2P网络贷款行业平稳健康发展。本文旨在通过建立贷款违约预测模型,对P2P网贷平台潜在违约客户进行准确识别,以期能够降低平台经营风险,优化我国互联网金融环境,降低互联网金融风险。针对目前我国P2P平台风险量化研究较少,运用机器学习算法较单一且缺乏运用多模型融合策略的实际情况,本文利用Python爬取人人贷借贷数据,借助Python、R等分析软件,首先进行了数据预处理和Cox生存分析等探索性统计分析,在对非平衡数据使用Border-line Smot算法处理后,通过IV信息价值与Gini指数相结合的特征筛选方法,构建Logistic、支持向量机、Adaboost、Xgboost、随机森林、朴素贝叶斯6组经典分类模型,通过网格搜索法对各模型进行参数调优后,使用F_2值作为模型性能评价指标,择优选出Logistic、支持向量机、Adaboost、Xgboost模型,最后通过Stacking算法融合4组模型建立最终的贷款违约预测模型,并得出以下结论:1)通过贷款生存时间分析发现,小额贷款相较大额贷款更容易违约,P2P网络借贷平台应加强小额贷款申请的监督审核工作;其次借款人在贷款期限临近时期更容易出现违约的情况,平台在还款日临近之前,需要特别注意借款人近期的还款表现,加强借款催收与监督工作。2)基于不同平衡比例的数据训练会影响模型性能,且训练数据越接近1:1平衡状态,模型性能越差,训练数据平衡比为1:3时是更利于模型性能的处理。3)不基于Stacking融合算法时,Xgboost模型在各单组模型中表现最好,优于其余经典分类模型建立个人贷款违约预测模型。4)基于Logistic、支持向量机、Adaboost、Xgboost四组模型建立的Stacking融合模型在所有模型中表现最好,证明了本文建立的Stacking融合模型是表现更优的个人贷款违约预测模型,以及Stacking模型融合算法在个人贷款违约预测领域的优越性,对于将模型融合算法应用到我国个人贷款违约预测领域有一定的参考价值。5)从模型应用角度出发,通过控制变量法研究了单个借款客户在不同利率水平下,模型的预测违约概率的变化情况,通过调整借款利率来改变其相应的违约概率,使之降至平台可接受的违约概率范围,对于协助平台实现不良客户转化具有一定的积极意义。


知网文化
【相似文献】
中国期刊全文数据库 前18条
1 凌云;王建东;;浅析4~#高炉的炉缸侵蚀预测模型[J];南钢科技与管理;2007年03期
2 谷鸿秋;王俊峰;章仲恒;周支瑞;;临床预测模型:模型的建立[J];中国循证心血管医学杂志;2019年01期
3 周媛;叶烨;王新彦;周宏根;王筱蓉;;零转弯半径割草机连续翻滚特性参数化预测模型[J];农机化研究;2018年01期
4 刘洪太;郭云霞;;基于情景数据的火灾预测模型设计与实现[J];科技创新与应用;2018年26期
5 王伟卿;;灰色预测模型在预测话音网关故障中的研究与应用[J];计算机测量与控制;2016年11期
6 韩文倩;;灰色预测模型在山东省保费预测中的应用[J];保险职业学院学报;2017年01期
7 杨萌;;基于灰色预测模型的山西省批发零售业人员需求分析[J];数学的实践与认识;2017年04期
8 崔剑;巴合提努尔·巴赞;李书钦;;烧结过程SO_2排放预测模型研究[J];资源节约与环保;2017年08期
9 张春涛;关文忠;刘学飞;;混沌时间序列的2阶预测模型[J];数学的实践与认识;2016年05期
10 夏静;;建设项目环境影响评价预测模型发展现状[J];绿色科技;2016年08期
11 杨学超;吴雷;;多项式预测模型在沉降变形监测当中的应用[J];矿山测量;2015年02期
12 张蕊;郑黎强;潘国伟;;疾病发病风险预测模型的应用与建立[J];中国卫生统计;2015年04期
13 杨德成;马艳英;;基于大数据背景下出版产业人才需求综合预测分析[J];明日风尚;2017年19期
14 祖定利;;一类优化的预测模型[J];山西青年;2013年24期
15 胡堃;李亚辰;崔欣茹;;灰色预测模型及其应用[J];旅游纵览(行业版);2012年05期
16 王晓军;王述珍;;社会保障基金长期财务随机预测模型的比较与选择[J];统计研究;2012年09期
17 蓝永康;;基于认知的预测模型对美的解析[J];美与时代(下);2011年04期
18 李闽榕;;省域经济综合竞争力预测指标与预测模型适应性分析[J];综合竞争力;2010年02期
中国重要会议论文全文数据库 前10条
1 匡启帆;李益洲;李梦龙;;对于药物不良反应预测模型的系统研究[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
2 肖健华;吴今培;;基于支持向量机的预测模型及应用[A];2003年中国智能自动化会议论文集(下册)[C];2003年
3 王坤龙;;天津地区雾霾的成因及预测模型建立的研究[A];科学发展·协同创新·共筑梦想——天津市社会科学界第十届学术年会优秀论文集(中)[C];2014年
4 郭庆春;;基于人工神经网络的空气污染指数预测模型[A];Proceedings of Conference on Environmental Pollution and Public Health(CEPPH 2012)[C];2012年
5 王亮;刘豹;徐德民;;预测模型的选择及其智能化实现[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年
6 罗荣桂;黄敏镁;;基于自适应神经模糊推理系统的服务业发展预测模型[A];Well-off Society Strategies and Systems Engineering--Proceedings of the 13th Annual Conference of System Engineering Society of China[C];2004年
7 付冰;陆阿明;;我国体育产业预测模型的构建与实证研究[A];第十一届全国体育科学大会论文摘要汇编[C];2019年
8 何彭君;;事故预测模型的建立与应用[A];安全责任与素养提升的实践研究——2017安全科学与工程技术研讨会论文集[C];2017年
9 李阳旭;邓辉文;;一种新的企业市场预测模型及其比较研究[A];2004年中国管理科学学术会议论文集[C];2004年
10 张晓晞;;全球煤炭产量的灰色预测模型[A];中国现场统计研究会第十三届学术年会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 邓婉玲;基于影像组学的子宫内膜癌淋巴结转移术前预测模型的研究[D];北京协和医学院;2019年
2 邓宇珺;联合血胱抑素C和尿NAG酶预测重症患者急性肾损伤及构建风险预测模型[D];南方医科大学;2019年
3 杨居衡;多相体系蜡析出计算模型研究[D];中国石油大学(北京);2018年
4 高山砚;妊娠期糖尿病危险因素研究与预测模型构建[D];中国医科大学;2019年
5 李金金;天津市慢性病队列研究及风险预测模型的建立[D];天津医科大学;2018年
6 陈玲;孕期及产后压力性尿失禁风险预测模型的构建、验证及应用[D];南方医科大学;2018年
7 云科;MSM人群HIV感染风险预测模型的建立及应用[D];中国医科大学;2018年
8 林开阳;急诊经皮冠状动脉介入术后对比剂肾病的危险因素分析及风险预测模型构建[D];南方医科大学;2018年
9 支元杰;大气环境下小样本金属材料腐蚀的数据驱动预测模型[D];北京科技大学;2019年
10 冉祥栋;基于深度学习的交通时间预测模型与方法研究[D];北京科技大学;2019年
中国硕士学位论文全文数据库 前10条
1 彭天恒;污染条件下铝合金滑阀耐磨性仿真分析及实验研究[D];湘潭大学;2019年
2 郭佳;基于机器学习算法的企业用电预测模型研究[D];重庆邮电大学;2019年
3 王泽宇;基于粒子群优化算法的电信客户流失预测模型的设计与实现[D];中国科学院大学(中国科学院人工智能学院);2019年
4 程丽;湖南省GDP预测模型比较[D];湘潭大学;2019年
5 董勋凯;智慧农业灌溉系统研究[D];西安工程大学;2019年
6 郭彦男;基于大数据技术的智能电网企业日用电量预测模型实现[D];广东工业大学;2019年
7 王竟羽;基于Stacking的P2P贷款违约预测模型构建及应用[D];成都理工大学;2019年
8 MUGISHA THEOPHILE;[D];厦门理工学院;2019年
9 张黎;FDM制品层间力学性能及承载失效预测方法研究[D];大连理工大学;2019年
10 李云焕;基于多阶段方法的债券损失率预测模型[D];大连理工大学;2019年
中国重要报纸全文数据库 前10条
1 记者 黄辛;上海交通大学 提出基于信号通路的肝癌风险预测模型[N];中国科学报;2019年
2 记者 康民;全球首个流感预测模型落户重庆[N];中国保险报;2017年
3 北京大学肿瘤医院 刘晨;筛查食管癌有了风险预测模型[N];健康报;2017年
4 特约记者 刘京涛;华东化工销售员工设计价格预测模型见成效[N];中国石油报;2010年
5 本报记者 张超;预测模型:推算SARS起落潮[N];科技日报;2003年
6 刘庆;“预测模型”要缓行[N];网络世界;2006年
7 记者 华凌;颗粒物成云新理论有助改进预测模型[N];科技日报;2015年
8 四川农业大学 王立志 贾刚 王康宁;饲料有效磷的评定及预测模型的“雏形”[N];中国畜牧兽医报;2006年
9 张琳 赵伟;巧用Excel构建利润预测模型[N];财会信报;2007年
10 中兴通讯 曾志 杨毅;建立移动用户流失分析预测模型[N];通信产业报;2014年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978