基于深度强化学习算法的A股投资分析与实证文献综述

2020-04-24 11:29:08

深度学习是人工神经网络的一个分支，具有深度网络结构的人工神经网络是深度学习最早的网络模型。

1943年，美国数学家沃尔特#183;皮茨（W.Pitts）和心理学家沃伦#183;麦克洛克（W.McCulloch）首次提出了人工神经网络这一概念，并使用数学模型对人工神经网络中的神经元进行了理论建模。

1998年，燕#183;勒存（Y. LeCun）提出了深度学习常用模型之一卷积神经网络（Convoluted Neural Network， CNN）。

2009年，Yoshua Bengio提出了深度学习另一常用模型：堆叠自动编码器（Stacked Auto-Encoder,SAE），采用自动编码器来代替深度信念网络的基本单元：限制玻尔兹曼机，来构造深度网络。

1959年，Samuel最先提出了强化学习算法后将其成功运用于国际跳棋的游戏中。

在1998年Suton提出了TD（Temporal Difference）算法，并对其理论、收敛性和实际应用进行了详细解析。

1992年，Watkins提出Q-Learing算法，并证明了算法的收敛性。

1994年Littman针对只存在两个机器之间竞争的环境，创新的提出了极小极大Q算法理论。

Hu和Wellman在文章中指出通过将纳什均衡引入到强化学习算法当中去，并开创性的提出了Nash-Q算法。

Sachiyo和Arai和Katia Sycara提出利益分配方法。

剩余内容已隐藏，您需要先支付 5元才能查看该篇文章全部内容！立即支付