收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于多源异构信贷数据的信用评分模型评价分析

刘新星  
【摘要】:随着经济的高速发展和人们消费观念的变化,信用卡消费在日常消费中占着举足轻重的位置,很多人忽视隐藏在信贷消费背后的风险。我国信用制度发展时间短,目前还没有建立统一成熟的信用体系,如果机构和客户之间的信息不对称使得信贷风控机构不能有效的判断申请客户的信用等级程度,这将给机构带来很大的财务风险。因此,金融机构建立精准有效的信用评分模型对于控制信用卡违约风险,促进银行信用体系建设有着重要意义。数据的海量增长和广泛应用使得我们由信息时代迈入了数据时代,数据挖掘技术渗透到人们的日常生活并逐渐成熟。银行可以基于客户的个人信息和历史交易数据来建立信用卡违约预测模型,削弱信息不对称导致的金融风险。本文以数据竞赛平台Kaggle上的Give me Credit数据为例,首先对数据进行清洗和处理,主要是处理缺失值和异常值,确定特征之间的相关性程度,通过WOE编码和IV值筛选含有较多信息量的特征。针对样本类别不平衡的情况,采用了SMOTE过采样方法平衡数据集,建立了逻辑回归、支持向量机、梯度提升树GBDT、XGBoost、Light GBM五种分类模型用来判断申请客户是否会产生逾期还款或拖欠不还的行为,以模型的预测结果的_1F指标和AUC值衡量模型的准确性,以KS值衡量模型的可区分程度。本篇论文的创新之处在于以下部分:在随机过采样基础上采用SMOTE算法平衡数据类别,降低了过拟合的风险;将概率校准支持向量机算法、基于决策树的提升算法与传统的逻辑回归算法结果进行比较,模型选择上具有新颖性。实证结果表明,基于概率校准的支持向量机模型和XGBoost模型准确性和可区分程度最好,GBDT模型和逻辑回归模型次之,Light GBM表现较弱。但对于大样本而言,支持向量机计算复杂度高,效率低下,所以更推荐使用近年来流行的XGBoost算法,将XGBoost算法应用到机构的个人信用评分模型中,为审批人员提供必要的参考依据,具有一定的应用前景。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 黄新民;;商业银行信贷数据治理探讨[J];中国管理信息化;2014年19期
2 施宏斌;;信贷数据质量有待提高[J];金融电子化;2005年05期
3 张星;蒋秀才;杨坚刚;杨声钢;;商业银行信贷数据变更系统的研究与实践[J];金融电子化;2017年11期
4 高国勋;胡智宇;张星;郭宏星;;商业银行流程化信贷数据整改系统建设研究[J];农村金融研究;2016年12期
5 尹中立;;信贷增长将面临转折[J];卓越理财;2009年10期
6 ;政策适度发力 下半年经济有望缓中趋稳[J];财经界;2018年25期
7 卓崇安;用PPS算法实现贸易信贷数据自动抽样[J];华南金融电脑;2005年03期
8 洪灏;;央行会降息吗[J];股市动态分析;2014年32期
9 王勇;;村镇银行信贷数据体外循环存隐患[J];金融博览;2016年06期
10 ;数字[J];新理财(政府理财);2012年04期
11 哈继铭;;牛年伊始货币信贷数据解读[J];西南金融;2009年03期
12 ;信贷超额增长难持续 后续降息空间小 机构评述2月货币信贷数据[J];股市动态分析;2009年07期
13 耿凤柱;;征信系统与金融统计监测系统信贷数据差异比较[J];内蒙古金融研究;2013年12期
14 易宪容;;从信贷数据看房地产从紧货币政策[J];市场瞭望(下半月);2008年05期
15 申燚;;互联网金融时代下信用评分体系模型的构建[J];纳税;2019年02期
16 李欣姿;杨淞婷;曲哲霆;;农业信贷对农业产值影响的实证分析及完善举措研究——基于柯布-道格拉斯生产函数模型[J];南方农机;2021年23期
17 冯剑;;中国商业银行羊群行为实证分析[J];市场周刊(理论研究);2017年06期
18 刘煜辉;;信贷激增的几点担忧[J];今日财富(金融版);2009年02期
19 张俊宇;;A50中国基金对A股的指示效应[J];股市动态分析;2009年10期
20 胡艳妮;;“背离”与“井喷”——1月M1、M2、信贷数据之变[J];金融博览(银行客户);2009年03期
中国重要会议论文全文数据库 前20条
1 ;学术名家思想精粹[A];2014年国际货币金融每日综述[C];2014年
2 李建平;潘若愚;李轶琳;;一种简单而有效的信用评分方法[A];2004年中国管理科学学术会议论文集[C];2004年
3 朱小龙;张俊红;孙诗跃;林耕毅;张益铭;林杰威;;基于复杂性指标和光滑支持向量机的柴油机配气系统故障诊断方法[A];第十四届全国振动理论及应用学术会议(NVTA2021)摘要集[C];2021年
4 蓝小武;佟强;黄欣琰;王亮;;基于支持向量机核函数的智能辩识配电台区准确信息方法研究[A];用电与能效专题讲座暨智能用电及能效管理技术研讨会论文集[C];2019年
5 徐天扬;陈兰珍;;中红外光谱法结合支持向量机快速鉴别蜂蜜品种[A];21世纪第三届全国蜂业科技与海峡两岸蜂产业发展大会暨首届北京密云蜂产业发展高峰论坛论文集[C];2018年
6 郑春兵;;对装备使用维修费用预测方法的探索[A];寿命周期费用技术与协调发展[C];2010年
7 韩润繁;陈桂明;熊奇;高卫刚;;基于遗传算法和模拟退火算法并行优化支持向量机的武器装备费用估算[A];第十二届设备全寿命周期费用技术大会论文集[C];2018年
8 王梓笛;李双妹;李艳;尹延东;曹佳佳;张正勇;;基于拉曼光谱-支持向量机的乳制品快速智能鉴别技术研究[A];第21届全国分子光谱学学术会议暨2020年光谱年会论文集[C];2020年
9 熊浩;;基于支持向量机模型的快速公交行程时间算法对比研究[A];第十五届中国智能交通年会科技论文集(1)[C];2020年
10 李民策;王丽;李锡云;陈宗海;;基于支持向量机的电动汽车行驶工况识别方法[A];第21届中国系统仿真技术及其应用学术年会论文集(CCSSTA21st 2020)[C];2020年
11 王晓红;;一种改进多类支持向量机加权后验概率重构策略[A];2009中国控制与决策会议论文集(3)[C];2009年
12 余乐安;姚潇;;基于中心化支持向量机的信用风险评估模型[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
13 何琴淑;刘信恩;肖世富;;基于支持向量机的系统辨识方法研究及应用[A];中国力学大会——2013论文摘要集[C];2013年
14 郭一楠;程健;肖大伟;杨梅;;分布式多分类支持向量机[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年
15 汪荣贵;孙见青;胡琼;李守毅;;一种新的支持向量机决策树及其应用[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
16 伍敏;苏鹏宇;刘金福;于达仁;;基于RVM和SVM的风速预测研究[A];2012电站自动化信息化学术和技术交流会议论文集[C];2012年
17 曾江辉;耿金凤;汪邦军;郝建春;;面向时间序列质量波动预测的支持向量机回归模型研究[A];使命与责任—以质量方法促转型升级——第五届中国质量学术与创新论坛论文集(上)[C];2012年
18 刘爽;贾传荧;;一种加权支持向量机算法[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
19 张晓滨;尹英顺;赵培坤;马秀兰;;基于渐进直推支持向量机的半对半多类文本分类[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
20 张立刚;李海丽;;基于最小二乘支持向量机的协调系统预测[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
中国博士学位论文全文数据库 前20条
1 陈昊洁;基于选择性集成算法的个人信用评分方法研究[D];哈尔滨工业大学;2016年
2 王锐;稀疏逻辑回归二阶方法研究[D];北京交通大学;2021年
3 彭诗力;大规模混合数据分类的核方法研究[D];天津大学;2017年
4 肖雅静;基于支持向量机的滚动轴承故障诊断与预测方法研究[D];中国矿业大学(北京);2019年
5 胡庆辉;非稀疏多核支持向量机学习方法研究[D];武汉大学;2015年
6 李海生;支持向量机回归算法与应用研究[D];华南理工大学;2005年
7 阎满富;求解分类问题的支持向量机方法与应用研究[D];中国农业大学;2005年
8 陈素根;非平行平面支持向量机及特征提取中若干问题研究[D];江南大学;2016年
9 王瑜;基于支持向量机和多信息融合的局部放电故障诊断研究[D];华北电力大学;2015年
10 黄景涛;支持向量机算法参数选择及其在电站锅炉系统中的应用研究[D];浙江大学;2005年
11 黄华娟;孪生支持向量机关键问题的研究[D];中国矿业大学;2014年
12 唐发明;基于统计学习理论的支持向量机算法研究[D];华中科技大学;2005年
13 刘丽梅;基于支持向量机新算法的流程工业过程故障诊断方法研究[D];东北大学;2012年
14 孙宗海;支持向量机及其在控制中的应用研究[D];浙江大学;2003年
15 徐祥;大数据背景下支持向量机的随机坐标算法和鲁棒支持向量机研究[D];上海交通大学;2020年
16 陈立生;基于支持向量机的木材干燥预测控制技术[D];东北林业大学;2011年
17 徐红敏;基于支持向量机理论的水环境质量预测与评价方法研究[D];吉林大学;2007年
18 程丽丽;支持向量机集成学习算法研究[D];哈尔滨工程大学;2009年
19 陈爱军;最小二乘支持向量机及其在工业过程建模中的应用[D];浙江大学;2006年
20 王快妮;支持向量机鲁棒性模型与算法研究[D];中国农业大学;2015年
中国硕士学位论文全文数据库 前20条
1 刘新星;基于多源异构信贷数据的信用评分模型评价分析[D];山西大学;2021年
2 赵淑晨;个人信贷数据可视化分析系统的设计与实现[D];北京邮电大学;2021年
3 董潇;个人信贷数据违约挖掘模型的设计与分析[D];南京理工大学;2020年
4 张效齐;融合交易行为的银行客户信贷风险评估算法研究[D];西北大学;2021年
5 王小伟;基于逻辑回归与GBDT模型的银行信贷风险评估[D];汕头大学;2021年
6 高悦;信用评分中的拒绝推断[D];西南财经大学;2019年
7 徐昊;基于集成学习融合模型的信用评分模型改进与应用[D];厦门大学;2019年
8 秦晓琳;中小企业借贷信用分析系统的设计与实现[D];北京交通大学;2019年
9 刘倩;基于数据挖掘技术的信用评分卡模型研究[D];华中科技大学;2019年
10 夏商周;基于WoE-Logistic ogistic信用评分卡违约预测模型的网贷平台价值优化方法[D];华中师范大学;2019年
11 胡晶;Logistic及其改进方法在个人网贷信用评分中的应用[D];华中师范大学;2019年
12 周凤敏;聚焦型模型平均估计及其在信用评分中的应用研究[D];云南财经大学;2019年
13 冯佳伟;XGBOOST模型在信用评分卡中的应用[D];大连理工大学;2019年
14 吴佳辉;基于电信运营商大数据的用户信用评分卡的设计与实现[D];北京工业大学;2019年
15 张泽伟;基于决策树C5.0算法的P2P平台个人信用评分研究[D];天津财经大学;2018年
16 黄日康;基于XGBoost算法的个人信用评分方案策划[D];上海师范大学;2019年
17 盛惠;数据挖掘技术在零售银行申请信用评分卡上的应用[D];上海交通大学;2017年
18 卢婵;宁夏小微企业信用评分问题研究[D];东北大学;2015年
19 李昕;拒绝推断在信用评分卡模型中的应用[D];重庆大学;2018年
20 沈一;基于小额贷款的信用评分堆叠模型研究与应用[D];天津商业大学;2018年
中国重要报纸全文数据库 前20条
1 本报记者 刘丹;央行等三部门将建“中国绿色信贷数据中心”[N];科学时报;2011年
2 记者 杜川;2月信贷数据表现强劲 政策“不急转弯”带动经济复苏加快[N];第一财经日报;2021年
3 本报记者 魏再晨;五月信贷数据基本平稳[N];农村金融时报;2019年
4 北京商报记者 孟凡霞 马嫡;2019信贷数据出炉 今年降准仍存空间[N];北京商报;2020年
5 本报记者 刘琪;专家预计8月份信贷数据以结构性宽松为主 企业中长期贷款大概率好于去年同期[N];证券日报;2020年
6 记者 杜川;金融信贷数据基本稳定 央行称“我们有底气”[N];第一财经日报;2019年
7 本报记者 陈姝含;5月信贷数据走低 未来可适当降准[N];中国经济时报;2018年
8 本报记者 刘慧;5月信贷数据平稳 经济内生动能较强[N];中国经济时报;2018年
9 证券时报记者 罗晓霞;新增房贷继续火热 今年月均已近4800亿[N];证券时报;2016年
10 记者 高翔;1月信贷数据显示企业融资需求进一步回暖[N];上海证券报;2017年
11 本报记者 毛宇舟;1月份上海开发贷环比多增275.2亿元 刘明康警示风险 银行家看法分化[N];证券日报;2017年
12 记者 马翠莲;信贷数据低于预期无碍大局[N];上海金融报;2012年
13 证券时报记者 罗克关;3月信贷数据喜忧参半[N];证券时报;2012年
14 记者 郭茹;3月信贷数据揭盅在即紧缩预期有望继续降低[N];第一财经日报;2010年
15 记者 孟凡霞;8月信贷数据预示经济回暖[N];北京商报;2013年
16 记者 黄竞仪;6月信贷数据预告经济向好[N];北京商报;2009年
17 南方日报记者 黄倩蔚;信贷数据意外回落 经济放缓担忧加深[N];南方日报;2011年
18 本报记者 弘文;当三月信贷数据公布之后[N];上海证券报;2009年
19 叶苗;信贷数据吓坏A股 沪指失守4500点[N];南方日报;2008年
20 记者 王媛;央行释疑7月货币信贷数据:近几个月M2增速“失真”[N];上海证券报;2016年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978