一:背景介绍 最近在公司用spark的平台做了一个购物车的推荐,用到的算法主要是FGrowth算法,它是Apriori算法的升级版,算法的主要目的是找出频繁进行一起购买的商品.本文主要介绍两个算法的背景,触及到公司的推荐具体流程,这里就不介绍了. 二:Apriori Apriori算法是挖掘频繁项的基础算法,通过挖掘用户购买订单,发现频繁一起购买的商品集合.它采用一种逐层搜索的迭代方法,用k项集来搜索(k+1)项集.首先通过扫描数据中的订单,累计每项的计数,收集满足最小支持度的项,找出1项集的集…