收藏本站
《成都理工大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于R的P2P网贷平台风险识别实证研究

李玲  
【摘要】:近年来,互联网金融的兴起加快了整个金融市场的资金流动,各种新经济业态快速衍生,国内P2P行业的发展尤其迅速,P2P平台的数量每日都在增长,但伴随的问题与风险也逐步在提高,各种问题如携款跑路、资金提现困难、停业等层出不穷。投资者在进行投资时也面临了很大的风险,如何在投资时从各类P2P平台中识别出风险较高的平台,是政府以及投资者均面临的一大难题。本文旨在对P2P平台的风险进行识别,以便各投资者在投资决策过程中更加谨慎。本文主要通过模型比较找到一种分类性能最优的算法筛选出对P2P平台风险影响较大的最优指标组合,然后利用所选变量进行因子分析,计算出因子综合得分,利用综合得分对所选取的627家P2P平台进行评价排序,最终利用排名前后各50家P2P平台得分验证所建立的P2P平台风险评价体系的风险预测能力。在分析过程中本文主要借助R软件进行相关过程的分析,首先利用SVM算法、Boosting算法、随机森林算法、Bagging算法、CART算法、K近邻算法、二次判别分析模型共7种统计模型进行分类性能比较,通过10折交叉验证法划分训练集和测试集,分别计算7种模型的分类正确率,最终选择分类性能最优的随机森林算法进行特征选择,确定变量重要性大小,从32个变量中筛选出P2P平台风险识别的最优指标体系,特征结果表明对P2P平台风险影响较大的指标依次为评论综合得分、平均利率均值、借款人数均值、自动投标、保障方式、近30日资金净流入波动、评论数等15个指标。进一步利用因子分析,选出重要性最大的13个指标构建的P2P平台风险评价体系进行分析,提取出四个公因子,然后计算出P2P平台风险综合得分。最终利用综合得分对627家P2P平台进行排序,验证随机森林算法特征选择结果的合理性以及较好的P2P平台风险预测能力。其中初步选取的用于研究的32个变量分别来自样本平台的基础信息、成交信息、以及利用网络爬虫技术(如Python、八爪鱼等)爬取出的网民评论信息三个方面。在进行数据分析之前,首先进行数据缺失值、异常值、标准化处理等数据的预处理工作。缺失值处理方法主要为多重插补法;异常值处理方法主要利用随机森林模型的异常值诊断识别出异常点,然后删除再利用多重插补法填补;标准化处理需对正向化、逆向化指标分别处理。而在实证分析过程用SMOTE方法平衡了研究的样本数据。实证分析中得出以下结论:结论1:通过模型比较,随机森林模型在测试集与训练集的P2P平台风险预判正确率均为100%,从测试集总的分类正确率、第一类错误率(即高风险误判为低风险)、第二类错误率(即低风险误判为高风险)来看,Random Forest算法在P2P平台风险识别过程中分类性能最好,最终选择随机森林模型进行特征选择。结论2:用Random Forest算法进行特征选择结果表明,评论综合得分、平均利率均值、借款人数均值、自动投标、保障方式、近30日资金净流入波动、评论数等15个指标对P2P平台风险影响最大,最终通过因子分析计算出的综合得分,进一步验证Random Forest算法选出的指标组合分类性能较好。结论3:随机森林算法变量重要性分析以及因子分析过程中都发现,所有变量中外部的舆情信息为第一主因子,对P2P平台风险的影响最大,进一步说明网络舆情对P2P平台风险识别很关键。
【学位授予单位】:成都理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F832.2;F724.6

【参考文献】
中国期刊全文数据库 前10条
1 何剑;王小康;于淑利;;中国P2P网贷行业的风险评析——基于126家P2P网贷平台的实证[J];嘉应学院学报;2015年06期
2 李鹏飞;;浅析国内P2P网贷平台现状[J];新经济;2015年02期
3 陈秀梅;;论我国互联网金融市场信用风险管理体系的构建[J];宏观经济研究;2014年10期
4 扈震;王学武;;P2P网贷信息不对称问题研究[J];中国市场;2014年32期
5 黄小强;;P2P借贷服务业市场发展国际比较及借鉴[J];金融与经济;2013年12期
6 冯果;蒋莎莎;;论我国P2P网络贷款平台的异化及其监管[J];法商研究;2013年05期
7 张正平;胡夏露;;P2P网络借贷:国际发展与中国实践[J];北京工商大学学报(社会科学版);2013年02期
8 王鹏飞;;借鉴国外管理经验 完善我国网络借贷监管体系[J];内蒙古金融研究;2013年03期
9 鲁丹;丁晓斐;;论网络借贷的法律风险防范[J];法制博览(中旬刊);2013年02期
10 郭阳;;中国P2P小额贷款发展现状研究[J];上海金融;2012年12期
中国硕士学位论文全文数据库 前5条
1 陈丽;p2p借款人信用风险研究[D];华东政法大学;2016年
2 张慧;互联网金融的风险识别及控制研究[D];山东大学;2015年
3 唐嘉悦;P2P平台风险评价及控制研究[D];青岛理工大学;2015年
4 冯泽敏;中国P2P网络借贷信用风险研究[D];辽宁大学;2015年
5 郭弈;P2P网络借贷市场的融资成本与融资可获得性研究[D];西南财经大学;2011年
【共引文献】
中国期刊全文数据库 前10条
1 冯利华;;互联网金融基础条件运行过程中存在的问题思考[J];北京金融评论;2015年04期
2 刘志伟;;论P2P网络借贷平台业务发展的合法模式选择——从《关于促进互联网金融健康发展的指导意见》谈起[J];中南大学学报(社会科学版);2015年06期
3 郭晓辉;;我国P2P网贷平台风险管理对策研究[J];现代经济信息;2015年24期
4 彭炜;;我国P2P网贷平台问题及对策分析[J];湖北经济学院学报(人文社会科学版);2015年12期
5 王锡林;;P2P网络贷款的风险与防范[J];淮阴工学院学报;2015年06期
6 刘洪彬;郑超丹;;P2P网贷信用风险的产生机制、识别与防控文献综述[J];经营与管理;2015年12期
7 本刊编辑部;;中国经济法学发展评价(2012—2013) 基于期刊论文的分析[J];中外法学;2015年06期
8 程竹;;P2P网络借贷模式下小微企业融资风险及收益权衡[J];新经济;2015年35期
9 施慧洪;黄艺伟;;我国P2P网贷的主要模式、案例分析及比较[J];商业经济研究;2015年34期
10 陈致远;;P2P网络借贷的现状与发展初探[J];企业技术开发;2015年34期
中国硕士学位论文全文数据库 前10条
1 张威;我国P2P网贷平台风险管控研究[D];云南财经大学;2018年
2 李海燕(Haiyan Lee);现金贷平台风险控制模式创新研究[D];西南科技大学;2018年
3 吴限;P2P网络借贷过程中个体投资人资金供给的影响因素研究[D];江苏师范大学;2018年
4 杨巧艳;基于支持向量机的P2P借款人信用风险评估实证研究[D];上海外国语大学;2018年
5 刘明月;P2P网络借贷及其刑法规制问题研究[D];河北大学;2018年
6 武茗茗;P2P平台合规程度对投资者决策的影响研究[D];山东大学;2018年
7 刘焓樾;L公司风险管控体系优化研究[D];南昌大学;2018年
8 郭巍;P2B类互联网金融的风险控制与合作创新策略研究[D];北京邮电大学;2018年
9 崔炎炎;P2P网贷平台风险评价研究[D];北方工业大学;2018年
10 魏维;我国P2P网贷平台财务风险评价研究[D];武汉科技大学;2018年
【二级参考文献】
中国期刊全文数据库 前10条
1 李逸凡;;比较与借鉴——美国和中国P2P网贷平台的发展[J];理论月刊;2014年10期
2 罗斯丹;王苒;;我国加强P2P风险的监管研究[J];经济纵横;2014年09期
3 胡旻昱;孟庆军;;P2P网贷平台发展中的风险及其系统分析[J];武汉金融;2014年06期
4 邓青;;P2P网贷模式与风险监管探讨[J];财会通讯;2014年14期
5 庄博丞;王智勇;;我国互联网金融风险防范及发展趋势研究[J];时代金融;2014年14期
6 李真;;互联网金融:内生性风险与法律监管逻辑[J];武汉金融;2014年05期
7 徐会军;;利用互联网金融助推普惠金融创新发展的若干问题探讨[J];金融理论与实践;2014年04期
8 孙小丽;彭龙;;KMV模型在中国互联网金融中的信用风险测算研究[J];北京邮电大学学报(社会科学版);2013年06期
9 李媛;;国内外P2P融资模式的发展比较研究——兼论对中国的启示[J];浙江金融;2013年12期
10 袁博;李永刚;张逸龙;;互联网金融发展对中国商业银行的影响及对策分析[J];金融理论与实践;2013年12期
中国硕士学位论文全文数据库 前10条
1 曹玲燕;基于模糊层次分析法的互联网金融风险评估研究[D];中国科学技术大学;2014年
2 张雪梅;中国互联网金融模式分析及启示[D];外交学院;2014年
3 高瑞瑶;我国P2P网络借贷借款方风险分析与防范[D];中国社会科学院研究生院;2014年
4 王盛;P2P网络融资模式的风险管理[D];浙江理工大学;2014年
5 黄琼;P2P借贷行业的发展与风险控制[D];兰州大学;2014年
6 刘琳;几类回归模型中的变量选择方法[D];广西大学;2013年
7 刘峙廷;我国P2P网络信贷风险评估研究[D];广西大学;2013年
8 郭姗姗;论我国P2P网络借贷平台的法律规制[D];华东政法大学;2013年
9 薛群群;国内外P2P小额信贷企业运营模式研究及实例分析[D];中央民族大学;2013年
10 赵乐峰;P2P网络借贷融资可得性分析[D];河北经贸大学;2013年
【相似文献】
中国期刊全文数据库 前10条
1 胡蝶;;基于随机森林的债券违约分析[J];当代经济;2018年03期
2 赵艺淞;杨昆;王保云;黎晓路;;随机森林在城市不透水面提取中的应用研究[J];云南师范大学学报(自然科学版);2017年03期
3 吴辰文;梁靖涵;王伟;李长生;;一种顺序响应的随机森林:变量预测和选择[J];小型微型计算机系统;2017年08期
4 顾娟;林敏;鞠桂玲;;基于随机森林回归的军械器材需求预测[J];自动化应用;2017年09期
5 刘迎春;陈梅玲;;流式大数据下随机森林方法及应用[J];西北工业大学学报;2015年06期
6 罗超;;面向高维数据的随机森林算法优化探讨[J];商;2016年04期
7 杨晓峰;严建峰;刘晓升;杨璐;;深度随机森林在离网预测中的应用[J];计算机科学;2016年06期
8 张强;;随机森林在居民购房意愿研究中的应用[J];现代经济信息;2016年13期
9 凌俐;陈丽;谢兆莉;;随机森林法用于分析阿糖胞苷致不良反应发生的影响因素[J];中国药房;2015年08期
10 王婷;;基于随机森林的高光谱遥感图像分类[J];数码世界;2017年05期
中国重要会议论文全文数据库 前10条
1 尤东方;赵杨;;存在混杂时高维数据的随机森林分析[A];2017年中国卫生统计学学术年会论文集[C];2017年
2 张涛;李贞子;武晓岩;李康;;随机森林回归分析方法及在代谢组学中的应用[A];2011年中国卫生统计学年会会议论文集[C];2011年
3 吕洁;;基于随机森林算法对内蒙古地区地面逐日平均温度的估算[A];第34届中国气象学会年会 S20 气象数据:深度应用和标准化论文集[C];2017年
4 张炜;;天津市人才吸引力影响要素评价——基于随机森林法的检验分析[A];发挥社会科学作用 促进天津改革发展——天津市社会科学界第十二届学术年会优秀论文集(中)[C];2017年
5 高洪利;;基于随机森林算法的卷烟销量预测及分析[A];中国烟草学会学术年会优秀论文集[C];2017年
6 武晓岩;方庆伟;;基因表达数据分析的随机森林方法及算法改进[A];黑龙江省第十次统计科学讨论会论文集[C];2008年
7 高磊;秦慧杰;许康;;基于随机森林的资源三号影像地表覆盖信息提取[A];地理信息与人工智能论坛暨江苏省测绘地理信息学会2017年学术年会论文集[C];2017年
8 许允之;王舒萍;边宁;李鹏程;;基于随机森林算法的雾霾物质在沿面放电下分解特征研究[A];《环境工程》2018年全国学术年会论文集(下册)[C];2018年
9 郑志伟;邱佳玲;阳庆玲;龚晓春;郭山清;贾忠伟;郝春;;随机森林算法对文本情感分析的应用与R软件实现[A];2017年中国卫生统计学学术年会论文集[C];2017年
10 杨璐;宋建国;;基于随机森林的地震储层分类方法研究[A];2017中国地球科学联合学术年会论文集(三十八)——专题71:内磁层动力学、专题72:计算地球物理方法和技术、专题73:地热:“学”以致“用”、专题74:电磁卫星观测与应用[C];2017年
中国重要报纸全文数据库 前1条
1 本报记者 田新元;人工智能助力保险业智慧化转型[N];中国改革报;2017年
中国博士学位论文全文数据库 前10条
1 王晓军;基于大数据的风洞马赫数集成建模方法的研究[D];东北大学;2016年
2 王鑫;基于随机森林的认知网络频谱感知算法研究[D];东北大学;2016年
3 姚登举;面向医学数据的随机森林特征选择及分类方法研究[D];哈尔滨工程大学;2016年
4 黄玥;VANET信息安全问题及异常检测技术研究[D];吉林大学;2017年
5 倪强;基于随机前沿和随机森林法的沿海开发区发展效率研究[D];天津大学;2011年
6 季斌;内蒙古浩布高地区多金属矿综合信息找矿预测研究[D];合肥工业大学;2017年
7 雷震;随机森林及其在遥感影像处理中应用研究[D];上海交通大学;2012年
8 金超;基于随机森林的医学影像分割算法研究及应用[D];苏州大学;2017年
9 李宝富;巨厚砾岩层下回采巷道底板冲击地压诱发机理研究[D];河南理工大学;2014年
10 赵东;基于群智能优化的机器学习方法研究及应用[D];吉林大学;2017年
中国硕士学位论文全文数据库 前10条
1 何林;基于结核病的基因芯片数据挖掘及生物信息学分析[D];西南大学;2018年
2 吴裕浩;基于随机森林的椎骨CT图像检测算法研究[D];哈尔滨理工大学;2018年
3 朱晓蕾;基于压缩感知和随机森林的模式识别方法研究[D];哈尔滨工程大学;2018年
4 吕郅强;自动驾驶背景下的行人检测技术研究[D];哈尔滨理工大学;2018年
5 宋鑫;随机森林优化算法在农户信用风险评估中的应用[D];云南师范大学;2018年
6 赵佳楠;基于随机森林的长江三角洲PM_(2.5)浓度空间模拟及暴露风险评估[D];华东师范大学;2018年
7 耿晗;基于随机森林的苹果内部品质多标签分类方法研究[D];西北农林科技大学;2018年
8 许远静;病态嗓音特征提取与识别算法的研究[D];广西师范大学;2018年
9 郭永辉;基于情境感知的手机使用过程意外预防方法研究与系统实现[D];哈尔滨工业大学;2018年
10 周杰;Spark平台下的基于随机森林算法的用户贷款风险预测研究[D];东北师范大学;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026