基于深度强化学习算法的A股投资分析与实证文献综述
2020-04-24 11:29:08
深度学习是人工神经网络的一个分支,具有深度网络结构的人工神经网络是深度学习最早的网络模型。
1943年,美国数学家沃尔特#183;皮茨(W.Pitts)和心理学家沃伦#183;麦克洛克(W.McCulloch)首次提出了人工神经网络这一概念,并使用数学模型对人工神经网络中的神经元进行了理论建模。
1998年,燕#183;勒存(Y. LeCun)提出了深度学习常用模型之一卷积神经网络(Convoluted Neural Network, CNN)。
2009年,Yoshua Bengio提出了深度学习另一常用模型:堆叠自动编码器(Stacked Auto-Encoder,SAE),采用自动编码器来代替深度信念网络的基本单元:限制玻尔兹曼机,来构造深度网络。
1959年,Samuel最先提出了强化学习算法后将其成功运用于国际跳棋的游戏中。
在1998年Suton提出了TD(Temporal Difference)算法,并对其理论、收敛性和实际应用进行了详细解析。
1992年,Watkins提出Q-Learing算法,并证明了算法的收敛性。
1994年Littman针对只存在两个机器之间竞争的环境,创新的提出了极小极大Q算法理论。
Hu和Wellman在文章中指出通过将纳什均衡引入到强化学习算法当中去,并开创性的提出了Nash-Q算法。
Sachiyo和Arai和Katia Sycara提出利益分配方法。
您可能感兴趣的文章
- 腐败与美国各州收入不平等之间的关系:来自专家小组的协整和误差修正模型的证据外文翻译资料
- 内蒙古1962 – 2016年时间序列气候变量的变化特征外文翻译资料
- 残差修正法在季节性ARIMA电力需求预测中的应用:以中国为例外文翻译资料
- 净工资与居民消费价格指数的关系分析外文翻译资料
- 我国鸡蛋价格波动的深入研究与预测外文翻译资料
- 信赖域与线搜索技术的结合外文翻译资料
- 求解奇异非线性方程组的多点LM方法外文翻译资料
- 具有双线性和非单调发病率的关于两个菌株的流行病模型的全局稳定性分析外文翻译资料
- 寻找可伸缩的区块链结构: 工作证明与BFT复制外文翻译资料
- 网络营销中潜在成功人士的结构方程建模外文翻译资料