1. 定义 假设一串独立的伯努利实验(0-1,成功失败,伯努利实验),每次实验(trial)成功和失败的概率分别是 p 和 1−p.实验将会一直重复下去,直到实验失败了 r 次.定义全部实验中成功的次数为随机变量 X,则: X∼NB(r;p) 2. PMF(概率质量函数) f(k;r,p)≡Pr(X=k)=(r+k−1k)pk(1−p)r 最后一次显然为失败,前 r+k−1 中发生 k 次成功: 之所以称其为 negative binomial distribution(负二项式分布),在于:…
The zero-inflated negative binomial – Crack distribution: some properties and parameter estimation Zero-inflated models and estimation in zero-inflated Poisson distribution Count data and GLMs: choosing among Poisson, negative binomial, and zero-infl…
PDF version PMF Suppose there is a sequence of independent Bernoulli trials, each trial having two potential outcomes called "success" and "failure". In each trial the probability of success is $p$ and of failure is $(1-p)$. We are obs…
title: [概率论]5-5:负二项分布(The Negative Binomial Distribution) categories: - Mathematic - Probability keywords: - The Negative Binomial Distribution - The Geometric Distribution toc: true date: 2018-03-29 08:57:12 Abstract: 本文介绍负二项分布,几何分布的基础知识 Keywords: T…
影响因素 Tiered Distribution 中讨论的影响因素也适用于此模式.有关这些通用影响因素的讨论,请参阅"Tiered Distribution".下列影响因素仅适用于 Three-Tiered Distribution 模式: 数据库负载所具有的重要性要求数据库应当使用专用的服务器(或整个群集). 安全策略禁止将公司数据库驻留在直接连接到 Internet 的服务器上. 大量的用户使用他们自己的计算机或设备来访问解决方案.例如,您有一个 Web 应用程序,该应用程序具有大…
1. exponential family 给定参数 η,关于 x 的指数族分布定义为如下的形式: p(x∣∣η)=h(x)g(η)exp{ηTu(x)} 其中 x 可以为标量也可以为矢量,可以为离散也可是连续.其中 η 被称为分布的自然系数(natural parameters), g(η)∫h(x)exp{ηTu(x)}dx=1 2. 以指数分布的眼光看其他分布 伯努利分布(Bernoulli Distribution,也叫 0-1 分布): 伯努利分布的基本形式为(其中 μ 为事件可能发生…
1. 伯努利分布 伯努利分布(Bernoulli distribution)又名两点分布或0-1分布,介绍伯努利分布前首先需要引入伯努利试验(Bernoulli trial). 伯努利试验是只有两种可能结果的单次随机试验,即对于一个随机变量X而言: 伯努利试验都可以表达为“是或否”的问题.例如,抛一次硬币是正面向上吗?刚出生的小孩是个女孩吗?等等 如果试验E是一个伯努利试验,将E独立重复地进行n次,则称这一串重复的独立试验为n重伯努利试验.进行一次伯努利试验,成功(X=1)概率为p(0<=p<…
(2017-02-15 银河统计) 随机数生成是运用蒙特卡洛或统计随机模拟仿真方法的前提.本文在银河统计Web Service接口基础上,编制JS类函数生成常用分布随机数,为在网页中实现模拟仿真项目提供方便.相关参考文章统计随机数及临界值Web Service接口.在网页中运用统计Web Service接口和R语言-统计分布和模拟. 1.随机数生成及运用 随机数生成和赋值代码样例: var oURL=webTJ1.wsFC.getURL("normal_r",100,4,0,1,0);…
(2017-02-04 银河统计) 统计函数API概念   API(Application Programming Interface,应用程序编程接口)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节.   统计函数API是通过前台web网页传入数据和参数,服务器接收数据和参数后,经过统计计算返回结果的一种新型接口形式.   通常前台web网页很难处理复杂数学或统计问题,通过Web Service技术将数据和参…
名称 名称 R对应的名字 附加参数 β分布 beta beta shape1, shape2, ncp 二项式分布 binomial binom size, prob 柯西分布 Cauchy cauchy location, scale 卡方分布 chi-squared chisq df, ncp 指数分布 exponential exp rate F分布 F f df1, df1, ncp Gamma(γ)分布 gamma gamma shape, scale 几何分布 geometric g…
1.LDA概述 在机器学习领域,LDA是两个常用模型的简称:线性判别分析(Linear Discriminant Analysis)和 隐含狄利克雷分布(Latent Dirichlet Allocation).本文的LDA仅指代Latent Dirichlet Allocation. LDA 在主题模型中占有非常重要的地位,常用来文本分类. LDA是基于贝叶斯模型的,涉及到贝叶斯模型离不开“先验分布”,“数据(似然)”和"后验分布"三块.在贝叶斯学派中有: 先验分布 + 数据(似然)…
一些问题: 1. 什么时候我的问题可以用GLM,什么时候我的问题不能用GLM? 2. GLM到底能给我们带来什么好处? 3. 如何评价GLM模型的好坏? 广义线性回归啊,虐了我快几个月了,还是没有彻底搞懂,看paper看代码的时候总是一脸懵逼. 大部分分布都能看作是指数族分布,广义差不多是这个意思,我们常见的线性回归和logistic回归都是广义线性回归的特例,可以由它推到出来. 参考:线性回归.logistic回归.广义线性模型——斯坦福CS229机器学习个人总结(一) 对着上面的教程,手写了…
AVEDEV 用途:返回一组数据与其平均值的绝对偏差的平均值,该 函数可以评测数据(例如学生的某科考试成绩)的离散度. 语法:AVEDEV(number1,number2,...) 参数:Number1.number2....是用来计算绝对偏差平均 值的一组参数,其个数可以在 1-30 个之间. 实例:如果 A1=79.A2=62.A3=45.A4=90.A5=25,则公 式"=AVEDEV(A1:A5)"返回 20.16. AVERAGE     用途:计算所有参数的算术平均值.  …
无生物学重复RNA-seq分析 CORNAS: coverage-dependent RNA-Seq analysis of gene expression data without biological replicates BMC Bioinformatics 的一篇文章中提出了一种新的差异基因分析方法. 这篇文章提出了CORNAS(COverage-dependent RNA-Seq) 方法,利用贝叶斯方法来推断真实基因表达数的  后验分布. 其创新型之一该方法包括了由RNA样品浓度决定的…
title: [概率论]5-1:分布介绍(Special Distribution Introduction) categories: - Mathematic - Probability keywords: - Distribution toc: true date: 2018-03-27 20:35:20 Abstract: 本文介绍本章关于分布的内容提要 Keywords: Distribution 开篇废话 这篇就是个介绍,会非常短,但是还是有点点信息在里面的比如,给了一个分布的家族分类…
二项分布 | Binomial distribution 泊松分布 | Poisson Distribution 正态分布 | Normal Distribution | Gaussian distribution 负二项分布  | Negative binomial distribution 指数分布 | Exponential Distribution Βeta分布 | beta distribution Βeta二项分布 | Beta-binomial distribution 几何分布…
伯努利实验: 如果无穷随机变量序列  是独立同分布(i.i.d.)的,而且每个随机变量  都服从参数为p的伯努利分布,那么随机变量  就形成参数为p的一系列伯努利试验.同样,如果n个随机变量  独立同分布,并且都服从参数为p的伯努利分布,则随机变量  形成参数为p的n重伯努利试验. 伯努利试验是只有两种可能结果的单次随机试验. 如果试验E是一个伯努利试验,将E独立重复地进行n次,则称这一串重复的独立试验为n重伯努利试验. 一.伯努利分布: 伯努利分布亦称“零一分布”.“两点分布”.称随机变量X有…
Beta分布: 二项式分布(Binomial distribution): 多项式分布: Beta分布: Beta分布是二项式分布的共轭先验(conjugate prior) Dirichlet Distribution: 共轭先验可以使得先验分布和后验分布的形式相同 如果先验分布和似然函数可以使得先验分布和后验分布有相同的形式,那么就称先验分布与似然函数是共轭的 likelihood 似然函数 conjugate prior 共轭先验 posterior 后验 Normal  均匀分布 Nor…
title: [概率论]5-9:多项式分布(The Multinomial Distributions) categories: - Mathematic - Probability keywords: - The Multinomial Distributions toc: true date: 2018-04-04 22:17:23 Abstract: 本文介绍多项式分布的相关知识 Keywords: The Multinomial Distributions 开篇废话 生病的时候才会体会到…
1. Gamma函数 首先我们可以看一下Gamma函数的定义: Gamma的重要性质包括下面几条: 1. 递推公式: 2. 对于正整数n, 有 因此可以说Gamma函数是阶乘的推广. 3.  4.  关于递推公式,可以用分部积分完成证明: 2. Beta函数 B函数,又称为Beta函数或者第一类欧拉积分,是一个特殊的函数,定义如下: B函数具有如下性质: 3. Beta分布 在介绍贝塔分布(Beta distribution)之前,需要先明确一下先验概率.后验概率.似然函数以及共轭分布的概念.…
主讲人 网络上的尼采 (新浪微博: @Nietzsche_复杂网络机器学习) 网络上的尼采(813394698) 9:11:56 开始吧,先不要发言了,先讲PRML第二章Probability Distributions.今天的内容比较多,还是边思考边打字,会比较慢,大家不要着急,上午讲不完下午会接着讲. 顾名思义,PRML第二章Probability Distributions的主要内容有:伯努利分布. 二项式 –beta共轭分布.多项式分布 -狄利克雷共轭分布 .高斯分布 .频率派和贝叶斯派…
概率分布有两种类型:离散(discrete)概率分布和连续(continuous)概率分布. 离散概率分布也称为概率质量函数(probability mass function).离散概率分布的例子有伯努利分布(Bernoulli distribution).二项分布(binomial distribution).泊松分布(Poisson distribution)和几何分布(geometric distribution)等. 连续概率分布也称为概率密度函数(probability densit…
常用连续型分布介绍及R语言实现 R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大. R语言作为统计学一门语言,一直在小众领域闪耀着光芒.直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器.随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长.现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言. 要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,概率,统计知识,同时还要有创新精神,把R语言发挥到各个领…
1.Normal distribution In probability theory, the normal (or Gaussian or Gauss or Laplace–Gauss) distribution is a very common continuous probability distribution. Normal distributions are important in statistics and are often used in the natural and…
Random Variable \(\underline{cdf:}\)cumulative distribution function \(F(x)=P(X \leq x)\) \(\underline{pmf:}\)probability mass function(for discrete probability distribution ) (1)\(p(x) \geq0,x \in X\) (2)\(\sum\limits_{x \in X}P(x)=1\) \(\underline{…
Source: Sigma Zone, by Philip Mayfield The Binomial Distribution is commonly used in statistics in a variety of applications. Binomial data and statistics are presented to us daily. For example, in the election of political officials we may be asked…
 Fast RCNN 中将与 groud truth 的 IoU 在 [0.1, 0.5) 之间标记为负例, [0, 0.1) 的 example 用于 hard negative mining. 在训练时一般输入为N=2张图片, 选择 128 个 RoI, 即每张图片 64 个 RoI. 每张图片, 按照1:3的比例来抽取的 RoI 的话, 要在负例中抽取 48 个, Fast RCNN 采用 random sampling 策略. hard negative example 首先我们看看…
本博文来自<PRML第二章> 在第一章中说了对于模式识别问题来说,核心角色就是概率论.本章的目的一方面是为了介绍概率分布,另一方面也是为了对后面遇到的那些复杂问题先打下基础.本章关于分布上的一个讨论核心就是如何在给定有限的观测集合基础上对随机变量的概率分布进行建模,这也被称之为密度估计问题.本章中假设数据都是i.i.d 的.这里我们的强调下密度估计问题其实是个病态问题,因为对于某个观测到的有限数据集来说,其实是会有无限个概率分布可以可以如此表示. 什么分布最合适是需要基于模型选择问题上的考虑,…
log函数 从概率论和统计学角度看,Weibull Distribution是连续性的概率分布,其概率密度为: 其中,x是随机变量,λ>0是比例参数(scale parameter),k>0是形状参数(shape parameter).显然,它的累积分布函数是扩展的指数分布函数,而且,Weibull distribution与很多分布都有关系.如,当k=1,它是指数分布:k=2时,是Rayleigh distribution(瑞利分布). Weibull概率密度函数 k <1的值表示故障…
有一枚硬币(不知道它是否公平),假如抛了三次,三次都是“花”: 能够说明它两面都是“花”吗? 1 贝叶斯推断 按照传统的算法,抛了三次得到三次“花”,那么“花”的概率应该是: 但是抛三次实在太少了,完全有可能是运气问题.我们应该怎么办? 托马斯·贝叶斯(1702-1761),18世纪英国数学家,1742年成为英国皇家学会会员. 贝叶斯认为在实验之前,应根据不同的情况对硬币有所假设.不同的假设会得到不同的推断. 比如和滑不溜手的韦小宝玩.韦小宝可能拿出各种做过手脚的硬币,让我们猜不透,只能假设对硬…