PGM学习之六从有向无环图（DAG）到贝叶斯网络（Bayesian Networks）

本文的目的是记录一些在学习贝叶斯网络（Bayesian Networks）过程中遇到的基本问题。主要包括有向无环图（DAG），I-Maps，分解（Factorization），有向分割（d-Separation），最小I-Maps（Minimal I-Maps）等。主要参考Nir Friedman的相关PPT。

1 概率分布（Probability Distributions）

令X1,...,Xn表示随机变量；令P是X1,...,Xn的联合分布（joint distribution）。如果每个变量均可有两种取值（0-1分布），那么最终我们将得到2^n种取值，也就是说，我们需要用2^n个变量来描述P的分布。

2 随机变量的独立性

如果随机变量X和Y相互独立（independent），那么：

1）P（X=x|Y=y）=p(X=x)，对于所有的x和y均成立；2）也就是说，随机变量Y的取值（或者说随机事件Y是否发生），不影响X。

3）P(X,Y)=P(X|Y)*P(Y)=P(X)*P(Y)；

推广，如果X1，。。。，Xn独立，那么：

P(X1,,,,,Xn)=P(X1)...P(Xn)，共需O(n)个参数。

3 条件独立（Conditional Independence）

上述独立的情况比较理想，不幸的是，现实中大多数我们感兴趣的随机变量都不是相互独立的。更加常见的假设是条件独立。两个随机变量X和Y对于给定条件Z条件独立，如果：

P(X=x|Y=y,Z=z) = P(X=x|Z=z)，对于所有随机变量取值x,y,z均成立。

也就是说，当我们知道Z的取值时，Y的取值不影响X的预测。记为Ind(X;Y|Z)

4 马尔科夫假设（Markov Assumption）

马尔科夫假设是针对有向无环图做的更清晰的独立性假设。对于图G中的任意一个节点X，X代表一个随机变量，在给定X的父节点集Par(X)的情况下，X和X的所有非子节点相互独立。一般记作Ind(X;NonDesc(x)|Par(x))。这也称作变量的局部马尔科夫性。实例见下图：

5 I-Maps

一个有向无环图G是分布P的一个I-Map当对G的所有马尔科夫假设也适合于对P（假设G和P均具有相同的随机变量）。这是从有向无环图到概率公式推理的基础。

6 分解 Factorization

如果G是P的一个I-Map，那么我们能简化P的表示么？

例如，对于随机变量X和Y，如果Ind(X;Y)，我们可以知道：P(X|Y)=P(X)。

根据链式法则（Chain Rules），我们知道：P(X,Y)=P(X|Y)*P(Y)=P(X)*P(Y)。

这样，我们就将P(X,Y)简化成为P(X)*P(Y)的形式。

7 分解定理

如果G是P的一个I-Map，那么：

8 最小I-Map, Minimal I-Map

一个有向无环图G是P的一个最小I-Map当：G是P的一个I-Map；如果G‘是G的子图，那么G’不是P的I-Map。

9 d-separated 有向分割

d-separated这个概念是由Judea Pearl于1988年提出的算法的名字。这个算法是用来衡量图中的所有的条件独立关系。

令X, Y和Z是一个有向无环图 G中二个不相交节点的子集，如果在集合X和Y中所有节点间的所有路径都被集合Z所阻塞，则称集合X和Y被Z集合d-s eparation。

也称Z 为X和Y的切割集。否则，称在给定集合Z下集合X和Y依赖。

那么，什么时候称点集X和Y中所有节点间的路径被点集Z阻塞呢？如下图所示：

1.每条从A中的变量（顶点）到B中变量（顶点）的路径都经过集合Z，则称Z分开了点集A和B；

2.Z阻塞了从A到B的所有路径。

10 信息理论

增加这个定义的原因是因为评价概率模型时常常要用到，作为笔记留作查阅。

11.扩展阅读

图模型的介绍

An introduction to graphical models，Kevin P. Murphy

关于图模型的课程：课件以书的形式给出，易读

Statistical Learning Theory，berkeley CS281A

http://www.cs.berkeley.edu/~jordan/courses/281A-fall02/

更多的tutorials

http://www.cs.ubc.ca/~murphyk/

http://research.microsoft.com/~cmbishop/talks.htm

http://research.microsoft.com/~heckerman/

http://www.autonlab.org/tutorials/

http://www.cs.berkeley.edu/~jordan/tutorials.html

一些工具/源代码

Intel Probabilistic Network Library：C++

www.intel.com/technology/computing/pnl/index.htm

Jie Cheng ：KDDCup01的优胜者

http://www.cs.ualberta.ca/~jcheng/

Matlab工具：http://prdownloads.sourceforge.net/bnt/

PGM学习之六从有向无环图（DAG）到贝叶斯网络（Bayesian Networks）的更多相关文章

大数据工作流任务调度--有向无环图(DAG)之拓扑排序
点击上方蓝字关注DolphinScheduler(海豚调度) |作者:代立冬 |编辑:闫利帅回顾基础知识: 图的遍历图的遍历是指从图中的某一个顶点出发,按照某种搜索方法沿着图中的边对图中的所有顶点 ...
【学习笔记】有向无环图上的DP
手动博客搬家: 本文发表于20180716 10:49:04, 原地址https://blog.csdn.net/suncongbo/article/details/81061378 首先,感谢以下几 ...
C#实现有向无环图(DAG)拓扑排序
对一个有向无环图(Directed Acyclic Graph简称DAG)G进行拓扑排序,是将G中所有顶点排成一个线性序列,使得图中任意一对顶点u和v,若边(u,v)∈E(G),则u在线性序列中出现在 ...
【模板整合计划】图论—有向无环图 (DAG) 与树
[模板整合计划]图论-有向无环图 (DAG) 与树一:[拓扑排序] 最大食物链计数 \(\text{[P4017]}\) #include<cstring> #include<cs ...
判断有向无环图(DAG)
1.拓扑排序 bfs 所有入度为0的先入选. 2.tarjan 1个点1个集合 3.暴力一个点不能重新到达自己
[笔记] 有向无环图 DAG
最小链覆盖 (最长反链) 最小链覆盖 \(=n-\) 最大匹配. 考虑首先每个点自成一条链,此时恰好有 \(n\) 条链,最终答案一定是合并(首尾相接)若干条链形成的. 将两点匹配的含义其实就是将链合 ...
PGM：有向图模型：贝叶斯网络
http://blog.csdn.net/pipisorry/article/details/52489270 为什么用贝叶斯网络联合分布的显式表示 Note: n个变量的联合分布,每个x对应两个值 ...
PGM学习之五贝叶斯网络
本文的主题是“贝叶斯网络”(Bayesian Network) 贝叶斯网络是一个典型的图模型,它对感兴趣变量(variables of interest)及变量之间的关系(relationships) ...
【拓扑】【宽搜】CSU 1084 有向无环图 (2016湖南省第十二届大学生计算机程序设计竞赛)
题目链接: http://acm.csu.edu.cn/OnlineJudge/problem.php?id=1804 题目大意: 一个有向无环图(DAG),有N个点M条有向边(N,M<=105 ...

随机推荐

增强学习训练AI玩游戏
1.游戏简介符号A为 AI Agent. 符号@为金币,AI Agent需要尽可能的接取. 符号* 为炸弹,AI Agent需要尽可能的躲避. 游戏下方一组数字含义如下: Bomb hit: 代表目 ...
ThreadPoolExecutor 使用说明
它是一个ExecutorService,使用线程池中的线程执行提交的任务.通常我们使用Executors框架,定义使用. 线程池主要用来解决两类问题:通过缓存一定数量的可用线程,避免频繁的线程创建,销 ...
2.2 Oracle之DML的SQL语句之多表查询以及组函数
一.SQL的多表查询: 1.左连接和右连接(不重要一方加(+)) SELECT e.empno,e.ename,d.deptno,d.dname,d.loc FROM emp e,dept d WHE ...
python-gevent模块（自动切换io的协程）
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 import gevent def foo() ...
如何快速搭建yum源
yum命令能够从指定的服务器自动下载rpm包并安装,它最强大的地方就是可以自动处理软件包的依赖关系,能够一次安装所有依赖的关系包.下面将通过虚拟机平台介绍两种快速搭建yum源的方法: 一.有网络的情况 ...
笔试题——C++后序字符比较
题目:从两个数组的最后一个元素开始比较,输出数组中不同元素的个数.当一个数组的所有元素比较完成后,结束比较.a数组长度5,b数组长度3,a[ 4 ]和b[ 2 ]比较. 例: 输入: 77 21 1 ...
关于React面试题汇总
1.redux中间件中间件提供第三方插件的模式,自定义拦截 action -> reducer 的过程.变为 action -> middlewares -> reducer .这 ...
【quickhybrid】Android端的项目实现
前言前文中就有提到,Hybrid模式的核心就是在原生,而本文就以此项目的Android部分为例介绍Android部分的实现. 提示,由于各种各样的原因,本项目中的Android容器确保核心交互以及部 ...
java控制台编译通过，运行出现找不到或无法加载主类的情况
参考链接:http://www.knowsky.com/1046493.html 当建了一个包之后(假设建的包的名字为com),找到该java文件的com目录,发现编译能够通过,但是运行的时候出现了一 ...
java把map转json
JSONUtils.toJSONString(requestMap); com.alibaba.fastjson.JSON <!-- https://mvnrepository.com/a ...

PGM学习之六 从有向无环图（DAG）到贝叶斯网络（Bayesian Networks）

PGM学习之六 从有向无环图（DAG）到贝叶斯网络（Bayesian Networks）的更多相关文章

随机推荐

热门专题

PGM学习之六从有向无环图（DAG）到贝叶斯网络（Bayesian Networks）

PGM学习之六从有向无环图（DAG）到贝叶斯网络（Bayesian Networks）的更多相关文章