如今的推荐系统,对于实时性的要求越来越高,实时推荐的流程大致可以概括为这样: 推荐系统对于用户的请求产生推荐,用户对推荐结果作出反馈 (购买/点击/离开等等),推荐系统再根据用户反馈作出新的推荐.这个过程中有两个值得关注的地方: 这可被视为是一个推荐系统和用户不断交互.互相影响的过程. 推荐系统需要对用户反馈作出快速及时的响应. 这两点本篇分别通过强化学习和 Flink 来实现,而在此之前先了解一些背景概念. 强化学习 强化学习领域的知名教材 <Reinforcement Learning: A…