版权声明:本文为博主原创文章,未经博主允许不得转载. Apriori算法: 使用一种称为逐层搜索的迭代方法,其中K项集用于搜索(K+1)项集. 首先,通过扫描数据库,统计每个项的计数,并收集满足最小支持度的项,找出频繁1项集的集合.该集合记为L1.然后,使用L1找出频繁2项集的集合L2,使用L2找出L3,如此下去,直到不能再找到频繁K项集.找出每个Lk需要一次数据库的完整扫描. 为了提高频繁项集逐层产生的效率,一种称为先验性质的重要性质用于压缩搜索空间. 先验性质:频繁项集的所有非空子集也一定是