学术潜规则: 概率图模型提出的意义在于将过去看似零散的topic/model以一种统一的方式串联了起来,它便于从整体上看待这些问题,而非具体解决了某个细节. 举个例子:梯度下降,并非解决神经网络收敛问题而专门提出的什么算法,其实是凸优化理论中的一部分.凸优化理论的作用就是概率图模型的贡献所在. 统计机器学习,有数学系角度的认识,也有计算机系角度的认识. 统计机器学习 - 张志华 该课程更偏向于数学系视角,所以课程中包含了大量的概率基础.但课程的top不够,但并非讲师不行,而是计算机系的学生并未系…
Software for drawing bayesian networks (graphical models) 这里需要调用 latex 中的绘图库:TikZ and PGF. 注意,下述 tex 代码使用 pdflatex (不是 pdflex)进行编译. \documentclass[11pt]{report} \usepackage{tikz} \usetikzlibrary{fit,positioning} \begin{document} \begin{figure} \cente…
本篇博客是Daphne Koller课程Probabilistic Graphical Models(PGM)的学习笔记. 概率图模型是一类用图形模式表达基于概率相关关系的模型的总称.概率图模型共分为三个部分,分别为表示理论,推理理论和学习理论.基本的概率图模型包括贝叶斯网络.马尔科夫网络和隐马尔科夫网络. Student Example 一个学生,拥有成绩.课程难度.智力.SAT的分.推荐信等变量. 通过一张图可以把这些变量的关系表示出来,可以想象成绩由课程难度和智力决定,SAT成绩由智力决定…
http://blog.csdn.net/pipisorry/article/details/51461878 概率图模型Graphical Models简介 完全通过代数计算来对更加复杂的模型进行建模和求解.然而,我们会发现,使用概率分布的图形表示进行分析很有好处.这种概率分布的图形表示被称为概率图模型( probabilistic graphical models ).这些模型提供了几个有用的性质:• 它们提供了一种简单的方式将概率模型的结构可视化,可以用于设计新的模型.• 通过观察图形,我…
http://innopac.lib.tsinghua.edu.cn/search~S1*chx?/YProbabilistic+Graphical+Models&searchscope=1&SORT=DZ/YProbabilistic+Graphical+Models&searchscope=1&SORT=DZ&SUBKEY=Probabilistic+Graphical+Models/1,143,143,B/frameset&FF=YProbabilis…
独立(Independence) 统计独立(Statistical Independence) 两个随机变量X,Y统计独立的条件是当且仅当其联合概率分布等于边际概率分布之积: \[ X \perp Y \leftrightarrow P(X,Y)=P(Y) P(Y) \] 思考:假设 \(X \perp Y\),\(Y \perp Z\),那么 \(X\) 和 \(Y\) 有没有独立关系呢? 举例:爸吃饭,奥巴马吃饭,妈吃饭 条件独立(Conditional Independence) 两个随机…
目录 Probabilistic Graphical Models Statistical and Algorithmic Foundations of Deep Learning 01 An overview of DL components Historical remarks: early days of neural networks Reverse-mode automatic differentiation (aka backpropagation) Modern building…
一.PGM用来做什么 1.  医学诊断:从各种病症分析病人得了什么病,该用什么手段治疗 2.  图像分割:从一张百万像素级的图片中分析每个像素点对应的是什么东西 两个共同点:(1)有非常多不同的输入变量:(2)对于算法而言,结果都是不确定的 二.PGM各代表什么 1.  Models 2.  Probabilistic (1)概率:设计model即是为了分析一些不确定的东西(uncertainty) (2)Uncertainty的来源: (3)概率在模型表达上的优势 3.  Graphical…
主讲人 网神 (新浪微博: @豆角茄子麻酱凉面) 网神(66707180) 18:52:10 今天的内容主要是: 1.贝叶斯网络和马尔科夫随机场的概念,联合概率分解,条件独立表示:2.图的概率推断inference. 图模型是用图的方式表示概率推理 ,将概率模型可视化,方便展示变量之间的关系,概率图分为有向图和无向图.有向图主要是贝叶斯网络,无向图主要是马尔科夫随机场.对两类图,prml都讲了如何将联合概率分解为条件概率,以及如何表示和判断条件依赖. 先说贝叶斯网络,贝叶斯网络是有向图,用节点表…
有关因子图(factor graphs)以及其在sum product 算法,max-algorithm中的应用,将在一下篇博客中分享. 谢谢您的关注,欢迎提出意见问题.…
一.How to construct the dependency? 1.首字母即随机变量名称 2.I->G是更加复杂的模型,但Bayes里不考虑,因为Bayes只是无环图. 3.CPD = conditional probability distribution.图中的每一个点都是一个CPD,这里5个点,就有五个CPD. 二.Chain Rule for Bayesian Neatworks 将整个Bayes网络的所有节点所构成的联合概率(Joint probability)利用链式法则(ch…
一.什么是factors? 类似于function,将一个自变量空间投影到新空间.这个自变量空间叫做scope. 二.例子 如概率论中的联合分布,就是将不同变量值的组合映射到一个概率,概率和为1. 三.几种操作(factor operation)的介绍 1.乘积 2.边缘化 3.缩减 四.总结(为何引入factor?) 1.对于定义高维空间的分布具有关键意义: 2.包括了概率分布的基本操作.…
转:http://www.cnblogs.com/Dzhouqi/p/3204353.html 部分图为手写,由于本人字很丑,望见谅,只是想把PRML书的一些部分总结出来,给有需要的人看,希望能帮到一些人理解吧. 下一篇,我将继续介绍本章内容8.2,条件独立…
Relevant Readable Links Name Interesting topic Comment Edwin Chen 非参贝叶斯   徐亦达老板 Dirichlet Process 学习目标:Dirichlet Process, HDP, HDP-HMM, IBP, CRM Alex Kendall Geometry and Uncertainty in Deep Learning for Computer Vision 语义分割 colah's blog Feature Visu…
前言: 本次实验是用EM来学习HMM中的参数,并用学好了的HMM对一些kinect数据进行动作分类.实验内容请参考coursera课程:Probabilistic Graphical Models 中的的最后一个assignmnet.实验用的是kinect关节点数据,由于HMM是一个时序模型,且含有隐变量,所以这个实验不是很好做.大家对HMM不熟悉的话可以参考网友的实验:code. kinect人体关节数据中, 每个关节点由3个坐标数据构成,多个关节点数据(实验中为10个)构成一个pose,多个…
前言: 本次实验包含了2部分:贝叶斯模型参数的学习以及贝叶斯模型结构的学习,在前面的博文PGM练习七:CRF中参数的学习 中我们已经知道怎样学习马尔科夫模型(CRF)的参数,那个实验采用的是优化方法,而这里贝叶斯模型参数的学习是先假定样本符合某种分布,然后使用统计的方法去学习这些分布的参数,来达到学习模型参数的目的.实验内容请参考coursera课程:Probabilistic Graphical Models中的assignmnet 8,实验code可参考网友的:code 实验中所用到的bod…
前言: 本次实验主要任务是学习CRF模型的参数,实验例子和PGM练习3中的一样,用CRF模型来预测多张图片所组成的单词,我们知道在graph model的推理中,使用较多的是factor,而在graph model参数的学习中,则使用较多的是指数线性模型,本实验的CRF使用的是log-linear模型,实验内容请参考 coursera课程:Probabilistic Graphical Models中的assignmnet 7. 实验code可参考网友的:code实验对应的模型示意图如下: CR…
前言: 本次实验是将一些简单的决策理论和PGM推理结合,实验内容相对前面的图模型推理要简单些.决策理论采用的是influence diagrams,和常见图模型本质一样, 其中的决策节点也可以用CPD来描述,做决策时一般是采用最大期望效用准则(MEU).实验内容参考参考的内容是coursera课程:Probabilistic Graphical Models中的assignment 5. 实验code可参考网友的:code. 实验中一些函数简单说明: Fnew = VariableElimina…
前言: 这次练习完成的是图模型的近似推理,参考的内容是coursera课程:Probabilistic Graphical Models . 上次实验PGM练习四:图模型的精确推理 中介绍的是图模型的精确推理,但在大多数graph上,其精确推理是NP-hard的,所以有必要采用计算上可行的近似推理.本实验中的近似推理分为2个部分,LBP(loop belief propagation算法)和MCMC采样.实验code可参考:实验code可参考网友的:code. 算法流程: LBP(loop be…
前言: 这次实验完成的是图模型的精确推理.exact inference分为2种,求边缘概率和求MAP,分别对应sum-product和max-sum算法.这次实验涉及到的知识点很多,不仅需要熟悉图模型的representation,而且还需明白图模型的inference理论,大家可参考coursera课程:Probabilistic Graphical Models的课件和视频.多花点功夫去理解每行代码,无形之中会收获不少.新年第一篇博客,继续加油! 算法流程: Sum-product求条件概…
循序渐进的学习步骤是: Markov Chain --> Hidden Markov Chain --> Kalman Filter --> Particle Filter Markov不仅是一种技术,更是一种人生哲理,能启发我们很多. 一个信息爆炸的时代 一.信息的获取 首先要获得足够多的信息以及训练数据,才能保证所得信息中包含足够有价值的部分.但往往因为“面子”.“理子”.“懒"等原因,在有意无意间削弱了信息的获取能力. 二.信息的提取 信息中包含噪声,噪声中充斥着“有意无…
http://blog.csdn.net/pipisorry/article/details/52599321 没时间看了,下次再看... 具有共享参数的学习模型 全局参数共享 局部参数共享 具有 共享参数的贝叶斯推断 层次先验* 皮皮blog 专栏17.E 文本分类的词袋模型 伯努利朴素贝叶斯模型和多项式朴素贝叶斯模型 隐含狄利克雷分布LDA 皮皮blog 泛化分析* 渐近性分析 PAC界 皮皮blog from: http://blog.csdn.net/pipisorry/article/…
http://blog.csdn.net/pipisorry/article/details/52578631 本文讨论(完备数据的)贝叶斯网的参数估计问题:贝叶斯网的MLE最大似然估计和贝叶斯估计.假定网络结构是固定的,且假定数据集D包含了网络变量的完全观测实例. 参数估计的主要方法有两种:一种基于最大的似然的估计:一种是使用贝叶斯方法. 贝叶斯网的MLE参数估计 最大似然估计MLE [参数估计:最大似然估计MLE] 简单示例:局部似然函数 仅包含两个二元变量的网络,即弧 从上看出,似然函数被…
http://blog.csdn.net/pipisorry/article/details/52489270 为什么用贝叶斯网络 联合分布的显式表示 Note: n个变量的联合分布,每个x对应两个值,共n个x,且所有概率总和为1,则联合分布需要2^n-1个参数. 贝叶斯网表示 独立性质的应用会降低参数数目,表达更紧凑. [PGM:贝叶斯网表示之朴素贝叶斯模型naive Bayes:独立性质的利用] 皮皮blog 贝叶斯网络 贝叶斯网络(Bayesian network),又称信念网络(Beli…
一 课程基本信息 本课程是由Prof.Daphne Koller主讲,同时得到了Prof. Kevin Murphy的支持,在coursera上公开传播.在本课程中,你将学习到PGM(Probabilistic Graphical Models)表示的基本理论,以及如何利用人类自身的知识和机器学习技术来构建PGM:还将学习到使用PGM算法来对有限.带噪声的证据提取结论,在不确定条件下做出正确的抉择.该课程不仅包含PGM框架的理论基础,还有将这些技术应用于新问题的实际技巧. 本课程包含以下主题:…
声明:本文转载自http://www.sigvc.org/bbs/thread-728-1-1.html,个人感觉是很好的PGM理论综述,高屋建瓴的总结了PGM的主要分支和发展趋势,特收藏于此. “概率模型与计算机视觉”林达华美国麻省理工学院(MIT)博士   上世纪60年代, Marvin Minsky 在MIT让他的本科学生 Gerald Jay Sussman用一个暑假的时间完成一个有趣的Project: “link a camera to a computer and get the c…
daft 的官方文档请见 DAFT:BEAUTIFULLY RENDERED PROBABILISTIC GRAPHICAL MODELS. from matplotlib import rc rc("font", family="serif", size=12) rc("text", usetex=True) import daft pgm = daft.PGM([3.6, 2.7], origin=[1.15, 0.65]) pgm.add_…
0.0 计算机科学 <Lex 与 Yacc> Think Complexity(使用 Python 语言) GitHub - AllenDowney/ThinkComplexity: Code for Allen Downey's book Think Complexity, published by O'Reilly Media. 0.1 语言类书 C/C++ Python Python 编程快速上手 -- 让繁琐工作自动化 R 语言 1. 计算机算法 算法导论 计算机程序设计艺术 I:基本…
前言: 接着coursera课程:Probabilistic Graphical Models上的实验3,本次实验是利用马尔科夫网络(CRF模型)来完成单词的OCR识别,每个单词由多个字母组合,每个字母为16×8大小的黑白图片.本次实验简化了很多内容,不需要我们去学这些参数(已提供),不需要掌握推理的方法(也提供了),目的是让大家对CRF模型有个感性认识.马尔科夫网络相比贝叶斯网络的优点就是不用自己去确定那些太明确结构(比如说那些因果关系). matlab基础知识: n = norm(X): 计…
前言: 这是coursera课程:Probabilistic Graphical Models上的第二个实验,主要是用贝叶斯网络对基因遗传问题进行一些计算.具体实验内容可参考实验指导教材:bayes network for genetic inheritance. 大家可以去上面的链接去下载实验材料和stard code,如实验内容有难以理解的地方,欢迎私底下讨论.下面是随便写的一些笔记. 完成该实验需要了解一些遗传方面的简单知识,可参考:Introduction to heredity(基因遗…