前言 经过2节对MovieLens数据集的学习,想必读者对MovieLens数据集认识的不错了:同时也顺带回顾了些Spark编程技巧,Python数据分析技巧. 本节将是让人兴奋的一节,它将实现一个基于Spark的推荐系统引擎. PS1:关于推荐算法的理论知识,请读者先自行学习,本文仅介绍基于ALS矩阵分解算法的Spark推荐引擎实现. PS2:全文示例将采用Scala语言. 第一步:提取有效特征 1. 首先,启动spark-shell并分配足够内存: 2. 载入用户对影片的评级数据: // 载…