适用场合

Apriori算法包含两部分内容：1，发现频繁项集 2，挖掘关联规则。

通俗地解释一下，就是这个意思：1.发现哪些项目常常同时出现 2.挖掘这些常常出现的项目是否存在“如果A那么B”的关系。

举个例子：网店购物订单常常会出现这样一种情况：那就是某几种物品常常一起买。比如锅和铲子、手机和手机壳等就会常常出现在同一个订单中，因此挖掘出哪些项目常常同时出现就是1中的问题。再进一步，对于这些常常出现的频繁项集，如果能挖掘出“若A则B”的更强关系，那就更好了。比如买了手机的常常会再买个手机壳，但是反过来不成立。

发现频繁项集

发现频繁项集最直观的想法，就是想办法对所有的项目进行全组合，也就是产生2ⁿ种，然后对这些不同的种类挨个计算出现最频繁的组合。但是这种方法的搜索空间太大，速度非常慢。Apriori定理可以很大程度上缩小搜索空间，其内容是：任一频繁项集的所有非空子集也必须是频繁的，也就是说，任何一个非频繁项集的超集一定也是非频繁项集。这样就可以直接删除所有包含非频繁项集的集合，很大程度上减少了搜索空间。

转载了一张图，非常明晰地说明了其中的道理：

（图片来源：http://www.jianshu.com/p/00103435ef89）

挖掘关联规则

挖掘关联规则是以频繁项集为基础的。假设我们已经找到了几个频繁项集，现在要找到其中是否蕴含“若A则B”的因果关系。

要想计算是否存在因果关系，很直观的想法就是计算条件概率P(B|A)，看看在A条件下B的概率是否足够高。

术语

假设项集有A，B。

有了上述的铺垫，现在引入术语定义：

支持度(support)：P(AB)，A和B同时出现概率。越大越频繁。

置信度(confidence)：P(B|A)，条件概率。越大说明因果越强。

提升度(lift)：P(B|A)/P(B)，有A这个条件和没有A这个条件时，B出现的概率之比。

实现

[机器学习] Apriori算法的更多相关文章

机器学习实战 - 读书笔记(11) - 使用Apriori算法进行关联分析
前言最近在看Peter Harrington写的"机器学习实战",这是我的学习心得,这次是第11章 - 使用Apriori算法进行关联分析. 基本概念关联分析(associat ...
Python两步实现关联规则Apriori算法，参考机器学习实战，包括频繁项集的构建以及关联规则的挖掘
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
机器学习实战（Machine Learning in Action）学习笔记————07.使用Apriori算法进行关联分析
机器学习实战(Machine Learning in Action)学习笔记————07.使用Apriori算法进行关联分析关键字:Apriori.关联规则挖掘.频繁项集作者:米仓山下时间:2018 ...
【机器学习实战】第11章使用 Apriori 算法进行关联分析
第 11 章使用 Apriori 算法进行关联分析关联分析关联分析是一种在大规模数据集中寻找有趣关系的任务. 这些关系可以有两种形式: 频繁项集(frequent item sets): 经常出 ...
【机器学习】Apriori算法——原理及代码实现（Python版）
Apriopri算法 Apriori算法在数据挖掘中应用较为广泛,常用来挖掘属性与结果之间的相关程度.对于这种寻找数据内部关联关系的做法,我们称之为:关联分析或者关联规则学习.而Apriori算法就是 ...
机器学习——使用Apriori算法进行关联分析
从大规模的数据集中寻找隐含关系被称作为关联分析(association analysis)或者关联规则学习(association rule learning). Apriori算法优点:易编码实现 ...
机器学习（八）—Apriori算法
摘要:本文对Apriori算法进行了简单介绍,并通过Python进行实现,进而结合UCI数据库中的肋形蘑菇数据集对算法进行验证. “啤酒与尿布”的例子相信很多人都听说过吧,故事是这样的:在一家超市中, ...
《机器学习实战》学习笔记第十一章 —— Apriori算法
主要内容: 一.关联分析二.Apriori原理三.使用Apriori算法生成频繁项集四.从频繁项集中生成关联规则一.关联分析 1.关联分析是一种在大规模数据集中寻找有趣关系的任务.这些关系可以 ...
机器学习（十五）— Apriori算法、FP Growth算法
1.Apriori算法 Apriori算法是常用的用于挖掘出数据关联规则的算法,它用来找出数据值中频繁出现的数据集合,找出这些集合的模式有助于我们做一些决策. Apriori算法采用了迭代的方法,先搜 ...

随机推荐

date时间转换
<!DOCTYPE html> <head> <meta http-equiv="Content-Type" content="text/h ...
MySQL实例
建表实例: CREATE TABLE command_content( ID ) PRIMARY KEY NOT NULL AUTO_INCREMENT, CONTENT ), COMMAND_ID ...
Failed to sync Gradle project 'XX'错误解决
错误代码 Failed to sync Gradle project 'WeChat' Error:Failed to find target with hash string 'android-24 ...
SQL显示某月全部日期明细以及SQL日期格式
SQL显示某月全部日期明细<存储过程> 方法一: declare @date datetime declare @end datetime ,getdate()) ,@date) crea ...
利用fputcsv导出数据备份数据
今天,分享一个利用fputcsv导出数据备份数据的方法,我也时看到些零零散散的代码,想着拼起来,所以我只提供些思路,以及简单的代码,至于怎么组合能够让它更强大,尽情去探索吧讲之前先上一段获取数据库里 ...
JSP include HTML出现乱码问题解决
Problem? 当使用<jsp:include page="top.html"></jsp:include>引入html文件时, 并且jsp 和 html ...
Android反编译odex然后重新打包
#Android反编译odex然后重新打包最近不知道怎么回事,突然把我那刷了氧OS的root了,然后就开始好奇起来氢OS所带有的那些本地化的东西,比如通话录音就是典型的一个之一.其中也做了很多的尝试 ...
Linux 学习记录四（Bash 和 Shell scirpt）
一.什么是 Shell? 狭义的shell指的是指令列方面的软件,包括基本的Linux操作窗口Bash等,广义的shell则包括图形接口的软件,因为图形接口其实也可以操作各种驱动程序来呼叫核心进行工 ...
为何你跟着滴滴D8级前端大神撸代码，技术却依旧原地踏步？
引子听说最近有很多小伙伴,热衷于在慕课网上学习各种前端实战教程,并以完成项目为奋斗目标.比如本文接下来要提到的<Vue2.0高级实战之开发移动端音乐App>,这门课程的传授者是来自滴滴D ...
小程序开发教程：wx.setTopBarText(OBJECT)
状态信息展示当小程序被显示在聊天顶部时,开发者可将重要的状态变更信息实时展示出来,便于用户及时获知. 详见文档:小程序文档小程序更新之后,有个更有用的功能!支持状态栏实时状态更新!! wx.set ...

[机器学习] Apriori算法

适用场合

发现频繁项集

挖掘关联规则

术语

实现

[机器学习] Apriori算法的更多相关文章

随机推荐

热门专题