title: [概率论]6-4:分布连续性修正(The Correction for Continuity) categories: - Mathematic - Probability keywords: - The Central Limit Theorem - Approximation toc: true date: 2018-04-09 15:25:31 Abstract: 本文介绍如何使用中心极限定理,将某区间上离散的随机变量,用一段连续的正态分布来近似 Keywords: The…
title: [概率论]5-1:分布介绍(Special Distribution Introduction) categories: - Mathematic - Probability keywords: - Distribution toc: true date: 2018-03-27 20:35:20 Abstract: 本文介绍本章关于分布的内容提要 Keywords: Distribution 开篇废话 这篇就是个介绍,会非常短,但是还是有点点信息在里面的比如,给了一个分布的家族分类…
概率分布有两种类型:离散(discrete)概率分布和连续(continuous)概率分布. 离散概率分布也称为概率质量函数(probability mass function).离散概率分布的例子有伯努利分布(Bernoulli distribution).二项分布(binomial distribution).泊松分布(Poisson distribution)和几何分布(geometric distribution)等. 连续概率分布也称为概率密度函数(probability densit…
6.3两正态总体的区间估计 (1)两个总体的方差已知 在R中编写计算置信区间的函数twosample.ci()如下,输入参数为样本x, y,置信度α和两个样本的标准差. > twosample.ci=function(x,y,alpha,sigma1,sigma2){ + n1=length(x);n2=length(y) + xbar=mean(x)-mean(y) + z=qnorm(1-alpha/2)*sqrt(sigma1^2/n1+sigma2^2/n2) + c(xbar-z,xb…
title: 本站目录 categories: Other sticky: 10 toc: true keywords: 机器学习基础 深度学习基础 人工智能数学知识 机器学习入门 date: 9999-12-31 23:59:59 本站包含作者原创的关于人工智能的理论,算法等博客,目前包括:强化学习,深度学习,机器学习,线性代数,概率论,数理统计,Python,爬虫等在目前人工智能领域需要用到的基础知识,欢迎大家订阅关注. 本站目录 首先插入一下我的整体研究思路,也是人工智能的技能树,我们要顺…
学习DIP第55天 转载请标明本文出处:***http://blog.csdn.net/tonyshengtan ***,出于尊重文章作者的劳动,转载请标明出处!文章代码已托管,欢迎共同开发:https://github.com/Tony-Tan/DIPpro 更多图像处理机器学习内容请访问最新网站www.tony4ai.com #开篇废话 废话开始,今天介绍OTSU算法,本算法比前面给出的算法更能够给出数学上的最佳阈值,不需要任何输入附加参数.与同样不需要输入附加参数的迭代均值和均值阈值来比较…
统计学上分布有很多,在R中基本都有描述.因能力有限,我们就挑选几个常用的.比较重要的简单介绍一下每种分布的定义,公式,以及在R中的展示. 统计分布每一种分布有四个函数:d――density(密度函数),p――分布函数,q――分位数函数,r――随机数函数.比如,正态分布的这四个函数为dnorm,pnorm,qnorm,rnorm.下面我们列出各分布后缀,前面加前缀d.p.q或r就构成函数名:norm:正态,t:t分布,f:F分布,chisq:卡方(包括非中心) unif:均匀,exp:指数,wei…
本文主要译自:MCMC:The Metropolis-Hastings Sampler 上一篇文章中,我们讨论了Metropolis 采样算法是如何利用马尔可夫链从一个复杂的,或未归一化的目标概率分布进行采样的.Metropolis 算法首先在马尔可夫链中基于上一个个状态 \(x^{(t-1)}\) 推荐一个新的状态 \(x^*\),这个新状态是根部建议分布 \(q(x^*|x^{(t-1)})\) 进行采样得到的.算法基于目标分布函数在 \(x^*\) 上的取值接受或者拒绝 \(x^*\).…
前言 在机器学习经典算法中,决策树算法的重要性想必大家都是知道的.不管是ID3算法还是比如C4.5算法等等,都面临一个问题,就是通过直接生成的完全决策树对于训练样本来说是“过度拟合”的,说白了是太精确了.由于完全决策树对训练样本的特征描述得“过于精确” ,无法实现对新样本的合理分析, 所以此时它不是一棵分析新数据的最佳决策树.解决这个问题的方法就是对决策树进行剪枝,剪去影响预测精度的分支.常见的剪枝策略有预剪枝(pre -pruning)技术和后剪枝(post -pruning )技术两种.预剪…
一.正态分布参数检验 例1. 某种原件的寿命X(以小时计)服从正态分布N(μ, σ)其中μ, σ2均未知.现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264                  222 362 168 250 149 260 485 170 问是否有理由认为元件的平均寿命大于255小时? 解:按题意,需检验 H0: μ ≤ 225     H1: μ >  225 此问题属于单边检验问题 可以使用R语言t.test t.test(x,y=N…