基于多因子模型的选股策略研究与实现文献综述
2020-04-14 20:02:45
量化投资是指通过数量化方式及计算机程序发出买卖指令,以获取稳定收益为目的的交易方式,经过几十年的发展,其优秀的投资业绩得到了越来越多投资者认可。在这几十年的发展过程中,量化交易的策略模型也在不断的变换中,从早期法国人路易·巴舍利耶的数理金融方法,到马克维茨提出的均值——方差模型、资产定价模型,再到现在依然大量使用的有效市场假说和Black——Scholes期权定价模型,金融市场的使用的方法层出不穷。老方法在新方法出现后黯然失色,而新方法大放光彩。
多因子模型是市场上新兴的应用广泛的一种选股模型策略。本策略会经常使用某种指标或者多种指标来对股票池进行筛选,这些用于选股的指标一般被称为因子。顾名思义,多因子模型是指使用多个因子,综合考量各因素而建立的选股模型,其假设股票收益率能被一组共同因子所解释。多因子模型的流程是因子的初步选取、进行有效性检验、因子的最终组合,在这之后进行策略设计。本模型的优点在于,它能通过有限的因子来有效地筛选数量庞大的个股,在大幅度降低问题难度的同时,也通过合理预测做出了判断。通过这种方式选出来的股票通常不会在某个因子上有特别的短板,能够综合很多信息最后得出一个选股结果。满足这些因子的股票则被买入,不满足的则卖出,从而规避风险,获取超额阿尔法收益。
传统多因子模型的因子主要依靠经济逻辑和市场经验对因子进行选取,然后基于数理统计的方法进行因子的计算处理,进而进行策略研究。而传统方式在两个方面都有一定的缺陷:一是开始处的因子选取,也许存在更为有效的因子埋藏在海量的数据当中,这时可以利用机器学习的方法在历史的数据去寻找更多的有效因子,增强模型的信息捕获能力。近年来有少量的研究成果,如将聚类分析等数据挖掘算法应用其中,成功引入新的因子。另外一方面是后期的有效因子组合,传统的数理统计方法效率较低,且效果不够好,这方面近年来有很多改进,如将集成学习、遗传算法、SVM等机器学习的思想或算法代替以往的数理统计方法,获得了更好的效果与收益。
{title}2. 研究的基本内容与方案
{title}本毕业设计的基本内容是在多因子模型的概念框架下,通过候选因子的选取与检验、有效因子的组合与去重、再用不同投资策略在历史数据下进行回测等步骤,利用机器学习的方法简化计算,从而完善模型,优化步骤。
具体目标是在最终选取的因子和确定的交易策略下,获取超过大盘的阿尔法收益。
拟采用的技术语言为Python3.7,一种动态的、面向对象的脚本语言,在科学计算和统计等领域有广泛的应用,基于此语言有很多的封装包,不用考虑偏底层的一些问题而专注于上层的算法和运算结果。
具体的软件是Anaconda5.2,这是一个数据科学平台,内置大量的包,不需要再额外下载其他的包,同时在运行时也不怕遇到各种各样的问题,完全能够满足需要。
此外还有数据源的获取,预计采用的是开源免费的Tushare包,能方便的获取交易的相关数据,包括普通的每日股票数据和企业的财务数据。
要加强学习Python的语法糖等内容,在后续的编码中减小工作量,同时也让代码更加高效。还要学习一定的金融知识,在模型不合适的情况下能更快定位错误位置,为后期做好铺垫。
3. 参考文献[1] 周鑫. 量化投资的“术”与“道”——量化技术在证券投资中的应用与风险控制[A]. .创新与发展:中国证券业2017年论文集[C].:中国证券业协会,2018:10.