Bayesian inference Using Gibbs Sampling

允许用户指定复杂的多层模型,并可使用MCMC算法来估计模型中的未知参数。

We use DAGs to specify models.


这里只涉及简单的贝叶斯网络,具体学习可见:

Carnegie Mellon University course 10-708, Spring 2017, Probabilistic Graphical Models

Ref: http://www.cnblogs.com/Dzhouqi/p/3204481.html

例子一

X and Y 不独立,但

X and Y 在Z情况下 条件独立。

表示:X ⊥ Y |Z

f (X, Y |Z) = f (X|Z) f (Y |Z).

知道了C 反而条件独立了? 如此理解:

a 孩子的血型是AB,其实“反作用”于c双亲不可能是O型血。然后,这个推断也影响了b孩子的血型可能性,即:也不可能是O型血。

  知道了c,比如c父母只有A and B血型因子,那么a and b孩子变为了在c已知的条件下的独立。

例子二

此例同上。

例子三

已知c,能得出a and b条件独立? 不能。


在Gibbs的一点用处

If we want to sample from p(A, B, C, D, F ) with a Gibbs sampler we define each marginal full conditional distribution using the conditional independence pattern of the DAG.


手头有这样的数据,如下:

建立一个模型吧:

简化模型:

指定”似然函数“和”先验分布”:

Deterministic functions can be removed/restructured, so that:


Bayesian inference Using Gibbs Sampling

Download:

http://www.openbugs.net/w/Downloads

Install:

To install this, unpack by typing

tar zxvf OpenBUGS-3.2.3.tar.gz
cd OpenBUGS-3.2.3

then compile and install by typing

./configure
make
sudo make install

Run:

lolo@lolo-UX303UB$ OpenBUGS
OpenBUGS version 3.2. rev
type 'modelQuit()' to quit
OpenBUGS>

Use:

https://www.youtube.com/watch?v=UhYAz6d5_qg

打开三类文件:model, data, init。

Model --> Specification 依次加载各个文件。

Inference --> Samples 其实就是监视Init里的四个参数。

Model --> Update 迭代操作一次(Here 每次1000下)


Prior Sensitivity Analysis  

The choice of prior(s) distribution must be determined with care, particularly, when the likelihood doesn't dominate the posterior.

If the likelihood dominates the posterior, the posterior distribution will essentially be invariant over a wide range of priors.

When the number of studies is large, the prior distribution will be less important. 数据量越大,先验的选择越不重要。

The non-informative prior distribution will be very useful in the situation when prior information, expectations and beliefs are minimal or not available.

Figure, 先验概率,后验概率 和 似然函数的关系

贝叶斯后验均值估计的最基本特性是伸缩性(shrinkage)。

  • 当似然函数的精度h0较大时, 后验均值主要受样本均值支配; 相反,
  • 当先验精度h1较大时, 后验均值主要受先验均值支配。

这就是为什么贝叶斯估计通常取先验精度较低的原因(方差给得较大),

也可以看出贝叶斯估计在调整先验精度下可以达到经典估计的效果,从某种意义上说经典估计是贝叶斯估计的特殊形式。

通过两种精度的调整达到对后验均值的估计叫做伸缩性估计特性, 所有贝叶斯估计的均值都具有伸缩性估计这个特性。

最后,推荐一篇至少题目看上去很牛的文章:


官方:http://www.openbugs.net/Manuals/InferenceMenu.html

民间1:http://www.biostat.jhsph.edu/~fdominic/teaching/bio656/labs/labs08/Lab8.IntroWinBUGS.pdf

民间2:http://www.stats.ox.ac.uk/~cholmes/Courses/BDA/Winbugs/winbugs-help.pdf

民间的更好,详细,良心作品。

收敛性检验:

• For models with many parameters, it is inpractical to check convergence for every parameter, so just chose a random selection of relevant parameters to monitor

一个一个地检查。

– For example, rather than checking convergence for every element of a vector of random effects, just chose a random subset (say, the first 5 or 10).

• Examine trace plots of the sample values versus iteration to look for evidence of when the simulation appears to have stabilised: (查看是否有稳定的迹象)

– To obtain ’live’ trace plots for a parameter:

  ∗ Select Samples from the Inference menu.

  ∗ Type the name of the parameter in the white box marked node.

  ∗ Click once with the LMB on the box marked trace: an empty graphics window will appear on screen.

  ∗ Repeat for each parameter required.

  ∗ Once you start running the simulations (using the Update Tool, trace plots for these parameters will appear ’live’ in the graphics windows.

– To obtain a trace plot showing the full history of the samples for any parameter for which you have previously set a sample monitor and carried out some updates:

  ∗ Select Samples from the Inference menu.

  ∗ Type the name of the parameter in the white box marked node (or select name from pull down list).

  ∗ Click once with the LMB on the box marked history: a graphics window showing the sample trace will appear.

  ∗ Repeat for each parameter required.

uniform时,将初始值调高,看明显看出收敛的速度。毕竟在实践当中,我们并不会知道,甚至无法估计参数的大概范围。

以下是model中变量的假设分布换为gaussian分布,收敛快了许多。

[Bayes] openBUGS: this is not the annoying bugs in programming的更多相关文章

  1. [Math] Hidden Markov Model

    链接:https://www.zhihu.com/question/20962240/answer/33438846   霍金曾经说过,你多写一个公式,就会少一半的读者. 还是用最经典的例子,掷骰子. ...

  2. 本人AI知识体系导航 - AI menu

    Relevant Readable Links Name Interesting topic Comment Edwin Chen 非参贝叶斯   徐亦达老板 Dirichlet Process 学习 ...

  3. [PGM] What is Probabalistic Graphical Models

    学术潜规则: 概率图模型提出的意义在于将过去看似零散的topic/model以一种统一的方式串联了起来,它便于从整体上看待这些问题,而非具体解决了某个细节. 举个例子:梯度下降,并非解决神经网络收敛问 ...

  4. [Scikit-learn] Dynamic Bayesian Network - Kalman Filter

    看上去不错的网站:http://iacs-courses.seas.harvard.edu/courses/am207/blog/lecture-18.html SciPy Cookbook:http ...

  5. 科学计算软件——Octave安装

    Octave是一个旨在提供与Matlab语法兼容的开放源代码科学计算及数值分析的工具,是Matlab商业软件的一个强有力的竞争产品. 参考:[ML:Octave Installation] Gener ...

  6. [Django] Setting up Django Development Environment in Ubuntu 14.04

    1. Python Of course you will need Python. Still Python 2.7 is preferred, however if you would like t ...

  7. Core Java Volume I — 3.5. Operators

    3.5. OperatorsThe usual arithmetic operators +, -, *, / are used in Java for addition, subtraction, ...

  8. 转:PHP – Best Practises

    原文来自于:http://thisinterestsme.com/php-best-practises/ There are a number of good practises that you s ...

  9. Delphi资源大全

    A curated list of awesome Delphi frameworks, libraries, resources, and shiny things. Inspired by awe ...

随机推荐

  1. weblogic清除缓存

    背景:在开发调试或测试时,很多时候重新更新部署服务后会发现某些更新并没有体现到,还是之前的情况,也或者会出现其他错误问题,这个时候就要考虑到可能是weblogic缓存未清理引起. 可以先尝试下面这种做 ...

  2. if判断比较详解

    shell判断数组中是否包含某个元素: ary=(1 2 3) a=2 if [[ "${ary[@]}" =~ "$a" ]] ; then    echo ...

  3. springboot之启动原理解析及源码阅读

    前言 SpringBoot为我们做的自动配置,确实方便快捷,但是对于新手来说,如果不大懂SpringBoot内部启动原理,以后难免会吃亏.所以这次博主就跟你们一起一步步揭开SpringBoot的神秘面 ...

  4. c++中string类对象和字符数组之间的相互转换

    string类在c++中是一个模板类,位于名字空间std中,注意这里不是string.h,string.h是C字符串头文件. 将string类型转换为字符数组char arr[10];string s ...

  5. iOS开发-命令模式

    命令模式算是设计模式中比较简单的,最常见的例子是工作任务安排下来进行编程,如果工作任务不需要完成,我们可以取消我们之前完成的代码,也可以理解为回滚撤销操作.这里面涉及到命令模式中的两个对象,一个是动作 ...

  6. 浅谈压缩感知(二十):OMP与压缩感知

    主要内容: OMP在稀疏分解与压缩感知中的异同 压缩感知通过OMP重构信号的唯一性 一.OMP在稀疏分解与压缩感知中的异同 .稀疏分解要解决的问题是在冗余字典(超完备字典)A中选出k列,用这k列的线性 ...

  7. .NET 并行编程——数据并行

    本文内容 并行编程 数据并行 环境 计算 PI 矩阵相乘 把目录中的全部图片复制到另一个目录 列出指定目录中的所有文件,包括其子目录 最近,对多线程编程,并行编程,异步编程,这三个概念有点晕了,之前我 ...

  8. 在Centos6或者7上安装Kafka最新版

    一.官网 http://kafka.apache.org/downloads.html 二.Kafka简介 Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写.K ...

  9. react 生命周期函数

    (1)初始化阶段:getDefaultProps:获取实例的默认属性static propTypes 设置属性的类型componentWillMount:组件即将首次被装载.渲染到页面上render: ...

  10. .NET 同步与异步之锁(ReaderWriterLockSlim)(八)

    本随笔续接:.NET 同步与异步之锁(Lock.Monitor)(七) 由于锁 ( lock 和 Monitor ) 是线程独占式访问的,所以其对性能的影响还是蛮大的,那有没有一种方式可是实现:允许多 ...