是无监督机器学习方法,用于知识发现,而非预测,无需事先对训练数据进行打标签,因为无监督学习没有训练这个步骤.缺点是很难对关联规则学习器进行模型评估,一般都可以通过肉眼观测结果是否合理. 一,概念术语 1,项集itermset 如上每个{ }内的都称为一个项集,LHS,RHS成为左右项集,他们之间不能有重复值交集 2,支持度support 项集的支持度就是该项集出现的次数除以总的记录数(交易数),意义是要统计出频繁项集 3,置信度confidence 关联规则 X -> Y 的置信度 计算公式 规…