收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于CatBoost算法的多因子量化选股策略研究

陈玄玄  
【摘要】:随着计算机和信息技术的发展,人们在股票市场的投资方式不再局限于传统投资的技术分析和基本面分析,基于二者的量化投资走进了人们的视野。量化投资凭着其纪律性、系统性、及时性及分散化的特点在投资界不断取得优异的投资回报,获得了人们的认可。纵观量化界,海外国家已经大规模地使用量化的方式进行投资决策,成为了不可获取的投资方式,而我国A股市场由于创立时间晚,制度不完善,起初量化投资在中国发挥的成绩并不是很理想,但随着这几年法律制度的不断完善,计算机硬件的性能提高,量化投资逐渐在中国火热起来,并取得了优秀的成绩。在量化投资策略中,多因子选股凭借着稳定性和覆盖面广泛,一直是研究的焦点。尤其是近几年随着人工智能和大数据的发展,机器学习算法结合多因子数据进行量化选股成为了新的研究热点。本文准备使用最新的集成学习算法Cat Boost并结合有效的因子进行多因子选股建模从而构建一套能够稳定地获取超额收益的量化投资组合。本文选取了沪深300成分股近8年季度财务比率数据以及每季度最后一个交易日数据作为模型的多因子,目标变量为下季度该只个股的涨和跌,对应数字1和0。首先对原始数据进行数据预处理,使得数据变成易于建模的干净数据,然后选取经典算法随机森林、GBDT梯度提升树和最新的Cat Boost算法进行建模,并使用重要的分类问题评价指标评估算法的表现。实证研究过程中包含单期建模比较三个算法的准确性和泛化能力,多期向前滚动建模检验模型的稳定性,然后进行了因子重要性分析,最后使用算法进行选股回测评价投资收益。根据三种算法建模效果比较,最后选择了Cat Boost算法进行因子选股,使用最近的三年12个季度的数据进行选股回测,每期选择5只股票等权重进行建仓调仓。通过计算收益,单期收益分析中,三年12期中有10期超过了同期基准收益,跑赢基准季度占比83.33%,有10期取得了正收益,占比达到83.33%,为期三年共获得了140%,年化复合收益率33.88%的投资收益回报,远超基准总收益17.27%的收益率,同时最大回撤为14.57%也在合理范围之内。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李姝锦;胡晓旭;王聪;;浅析基于大数据的多因子量化选股策略[J];经济研究导刊;2016年17期
2 王淑燕;曹正凤;陈铭芷;;随机森林在量化选股中的应用研究[J];运筹与管理;2016年03期
3 冯楠;陈有为;;基于量化趋势跟踪的计算机自动化选股模型的设计与实现[J];自动化与仪器仪表;2016年08期
4 ;技术指标选股[J];股市动态分析;2016年47期
5 ;技术指标选股[J];股市动态分析;2016年46期
6 ;技术指标选股[J];股市动态分析;2016年49期
7 ;技术指标选股[J];股市动态分析;2016年50期
8 ;技术指标选股[J];股市动态分析;2016年48期
9 ;技术指标选股[J];股市动态分析;2017年02期
10 ;技术指标选股[J];股市动态分析;2017年07期
11 ;技术指标选股[J];股市动态分析;2017年05期
12 ;技术指标选股[J];股市动态分析;2017年Z1期
13 杨君岐;郭虹泽;杨鹏程;李齐;;浅议量化选股与定性选股[J];时代金融;2017年06期
14 ;技术指标选股[J];股市动态分析;2016年45期
15 ;技术指标选股[J];股市动态分析;2017年08期
16 ;技术指标选股[J];股市动态分析;2017年11期
17 ;技术指标选股[J];股市动态分析;2017年01期
18 ;技术指标选股[J];股市动态分析;2017年12期
19 ;技术指标选股[J];股市动态分析;2017年15期
20 ;技术指标选股[J];股市动态分析;2017年13期
中国重要会议论文全文数据库 前5条
1 苏治;傅晓媛;;核主成分遗传算法与SVR选股模型改进[A];International Monetary Institute Working Papers(2010-2014年合辑)[C];2014年
2 林其经;余俊;谢琨;;大学生股票投资调查分析——以江西财经大学为例[A];2015年(第四届)全国大学生统计建模大赛论文[C];2015年
3 李从珠;姜铁军;肖春来;吴富锁;;成分股票价格指数编制模型的实证研究[A];Optimization Method, Econophysics and Risk Management--Proceedings of CCAST (World Laboratory) Workshop[C];2001年
4 陈凡;杨华蔚;;我国开放式基金选股择时能力的研究——基于半参数变系数模型的实证[A];系统工程理论与应用——贵州省系统工程学会第五届学术年会论文集[C];2014年
5 肖继辉;彭文平;;我国基金行业存在锦标赛效应吗?——来自开放式基金的经验证据[A];中国会计学会2011学术年会论文集[C];2011年
中国博士学位论文全文数据库 前2条
1 梁超;量化投资模型适应性研究[D];中央财经大学;2016年
2 刘维迪;基金经理投资积极性及其与基金业绩关系的研究[D];浙江大学;2016年
中国硕士学位论文全文数据库 前10条
1 陈玄玄;基于CatBoost算法的多因子量化选股策略研究[D];上海师范大学;2020年
2 胡谦;基于机器学习的量化选股研究[D];山东大学;2016年
3 陈志文;基于人工智能的量化选股模型设计与应用研究[D];北京化工大学;2019年
4 皋兴国;基于线性相关的社会网络选股及其分散化程度研究[D];南京大学;2015年
5 李雪莲;基本面与技术面相结合的A股量化选股模型设计[D];河北经贸大学;2015年
6 张亚龙;基于情绪择时下的多因子选股实证研究[D];首都经济贸易大学;2019年
7 陈栌;基于多因子选股模型的A股投资策略[D];浙江工商大学;2016年
8 王瑞;A股市场多因子量化选股研究[D];山西财经大学;2016年
9 林波;A资产管理公司量化选股模型改进研究[D];广东外语外贸大学;2016年
10 曹春晓;中国A股市场多因素选股模型实证分析[D];南京大学;2014年
中国重要报纸全文数据库 前10条
1 记者 王彭;外资勤跑上市公司 调研方向曝光下半年选股逻辑[N];上海证券报;2019年
2 本报实习记者 王宇露;源乐晟杨建海:淡化指数 强化选股[N];中国证券报;2019年
3 本报记者 郭子源;如何理性“选股”[N];经济日报;2020年
4 本报记者 李致鸿;跟着保险资金投资选股 2019年上市险企日赚7.87亿[N];21世纪经济报道;2020年
5 本报记者 王思文;首批6只可投资新三板基金将问世 精选层选股标准曝光[N];证券日报;2020年
6 高级投资顾问 苏渝;年底选股应避开“啃老股”[N];金融投资报;2018年
7 国金证券金融产品中心;注重选股 防御为先[N];中国证券报;2019年
8 本报记者 李惠敏 林荣华;机构坚持基本面选股思路[N];中国证券报;2019年
9 王忆;选股择时优势凸显 2019年上半年金鹰基金权益、固收业绩齐开花[N];中国经营报;2019年
10 本报记者 余世鹏;独立思考拒绝随波逐流 选股看重高投入产出比[N];中国证券报;2019年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978