欢迎大家关注微信公众号:DRL学习,我们一起来学习强化学习和深度强化学习的算法及现状应用问题. 强化学习简单说就是学习如何最大化未来奖励的预期总和,以及agent学会在环境中做出的行动序列,其中随机状态对代理人来说是未知的,并且取决于其行动.具体的强化学习分类如谢图所示,强化学习属于交叉学科,对于很多的计算及计算机学科都有帮助及涉及. 今天,就带大家来聊聊强化学习那些事以及小编这一年多走过的弯路,遇过的坑.前段时间看过一篇文章叫做<强化学习-从入门到放弃>,文章写的挺好的,而且句句扎心.内心不…