收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于Catboost算法的员工离职预测的研究

丁琦  
【摘要】:人才是企业的核心竞争力,人才也是各行各业发展的重要软资源是推进经济发展的重要动力,随着科技的飞速进步人才带给企业的效益是无法估量的。因此可见人才流失对企业的危害不言而喻,它会给公司运营成本甚至组织架构带来严重的威胁。因此对人力资源进行合理化管理,减少不必要的人才流失就显得尤为重要。据美国管理学会报告提出,员工离职后招聘成本至少相当于该岗位全年工资收入的30%。对于技能紧缺岗位,招聘成本相当于其全年工资的1.5倍,其中不包括空岗带来的企业损失(客户和关键技术流失、运营效率受到影响)、新员工培训成本等。现如今大数据已风靡全球,和互联网技术结合应用在各行各业的方方面面,它的出现让人们通过对数据进行分析获得知识成为可能,大数据让人们在很大程度上实现了从追求因果关系到相关关系探究的思维转变。本文正是借助数据思维和适合的机器学习算法,针对企业员工离职问题进行分析与预测。关注到员工数据可能存在类别型数据较多的情况,本文开创性的将机器学习的Cat Boost算法应用到员工离职方面,从而对员工离职进行预测模型的构建。本文数据来自开源的IBM HR数据。建立预测模型前,对数据进行了处理,清洗脏数据、数据标准化和描述性统计,对数据存在不平衡的情况采用了SMOTE算法进行过采样处理,以保证数据的有效性。还在建模前用SCAD算法对变量进行筛选,事实证明,经过SCAD算法筛选的变量建立的模型,在经过ROC(AUC)曲线和混淆矩阵的评估后显示其预测效果要优于未经过筛选的效果。最后,根据分析结果为公司提出了一些针对性的建议。


知网文化
【相似文献】
中国期刊全文数据库 前6条
1 党存禄;武文成;李超锋;李永强;;基于CatBoost算法的电力短期负荷预测研究[J];电气工程学报;2020年01期
2 姜琦刚;杨秀艳;杨长保;赵振贺;;基于CatBoost算法的面向对象土地利用分类[J];吉林大学学报(信息科学版);2020年02期
3 张德鑫;雒腾;曾志勇;;基于改进的SMOTE采样Catboost分类算法[J];信息通信;2020年01期
4 苗丰顺;李岩;高岑;王美吉;李冬梅;;基于CatBoost算法的糖尿病预测方法[J];计算机系统应用;2019年09期
5 马晓君;宋嫣琦;常百舒;袁铭忆;苏衡;;基于CatBoost算法的P2P违约预测模型应用研究[J];统计与信息论坛;2020年07期
6 刘嘉穗;;基于Catboost算法的优惠券个性化投放[J];电子世界;2018年23期
中国硕士学位论文全文数据库 前6条
1 丁琦;基于Catboost算法的员工离职预测的研究[D];上海师范大学;2020年
2 刘嘉穗;基于XGBoost和CatBoost相结合的消费券精准投放研究[D];广东工业大学;2019年
3 王浩;基于特征价格理论和CatBoost的旧机动车价值评估模型研究[D];天津商业大学;2019年
4 陈玄玄;基于CatBoost算法的多因子量化选股策略研究[D];上海师范大学;2020年
5 宋嘉绮;基于Catboost模型的商品期货交易策略设计[D];上海师范大学;2020年
6 饶泽炜;融入ESG信息的公司债违约风险识别方案策划[D];上海师范大学;2020年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978