基于多因子模型的选股策略研究与实现开题报告
2020-02-18 19:36:07
1. 研究目的与意义(文献综述)
量化投资是指通过数量化方式及计算机程序发出买卖指令,以获取稳定收益为目的的交易方式,经过几十年的发展,其优秀的投资业绩得到了越来越多投资者认可。在这几十年的发展过程中,量化交易的策略模型也在不断的变换中,从早期法国人路易·巴舍利耶的数理金融方法,到马克维茨提出的均值——方差模型、资产定价模型,再到现在依然大量使用的有效市场假说和black——scholes期权定价模型,金融市场的使用的方法层出不穷。老方法在新方法出现后黯然失色,而新方法大放光彩。
多因子模型是市场上新兴的应用广泛的一种选股模型策略。本策略会经常使用某种指标或者多种指标来对股票池进行筛选,这些用于选股的指标一般被称为因子。顾名思义,多因子模型是指使用多个因子,综合考量各因素而建立的选股模型,其假设股票收益率能被一组共同因子所解释。多因子模型的流程是因子的初步选取、进行有效性检验、因子的最终组合,在这之后进行策略设计。本模型的优点在于,它能通过有限的因子来有效地筛选数量庞大的个股,在大幅度降低问题难度的同时,也通过合理预测做出了判断。通过这种方式选出来的股票通常不会在某个因子上有特别的短板,能够综合很多信息最后得出一个选股结果。满足这些因子的股票则被买入,不满足的则卖出,从而规避风险,获取超额阿尔法收益。
传统多因子模型的因子主要依靠经济逻辑和市场经验对因子进行选取,然后基于数理统计的方法进行因子的计算处理,进而进行策略研究。而传统方式在两个方面都有一定的缺陷:一是开始处的因子选取,也许存在更为有效的因子埋藏在海量的数据当中,这时可以利用机器学习的方法在历史的数据去寻找更多的有效因子,增强模型的信息捕获能力。近年来有少量的研究成果,如将聚类分析等数据挖掘算法应用其中,成功引入新的因子。另外一方面是后期的有效因子组合,传统的数理统计方法效率较低,且效果不够好,这方面近年来有很多改进,如将集成学习、遗传算法、svm等机器学习的思想或算法代替以往的数理统计方法,获得了更好的效果与收益。
2. 研究的基本内容与方案
本毕业设计的基本内容是在多因子模型的概念框架下,通过候选因子的选取与检验、有效因子的组合与去重、再用不同投资策略在历史数据下进行回测等步骤,利用机器学习的方法简化计算,从而完善模型,优化步骤。
具体目标是在最终选取的因子和确定的交易策略下,获取超过大盘的阿尔法收益。
拟采用的技术语言为python3.7,一种动态的、面向对象的脚本语言,在科学计算和统计等领域有广泛的应用,基于此语言有很多的封装包,不用考虑偏底层的一些问题而专注于上层的算法和运算结果。
3. 研究计划与安排
(1) 2019年3月1日——2019年3月10日,强化python的异常处理和新语法糖等内容的学习,为后续的编程开路。
(2) 2019年3月11日——2019年3月12日,开发环境的搭建配置,anaconda平台和tushare包的安装。
(3) 2019年3月13日——2019年3月20日,进行数据的采集和预处理,包括离群值处理和标准化。
4. 参考文献(12篇以上)
[1] 周鑫. 量化投资的“术”与“道”——量化技术在证券投资中的应用与风险控制[a]. .创新与发展:中国证券业2017年论文集[c].:中国证券业协会,2018:10.
[2] 周志华. 机器学习[m]. 清华大学出版社, 2016.
[3] 李伟杰. 中国证券市场股票溢价的实证研究[d].山西财经大学,2016.