Hern\(\'{a}\)n M. and Robins J. Causal Inference: What If.

在之前, 一直假设样本数量足够大, 从而没有随机因素的影响(即把以个体看成一亿或者更多个体的集合).

但是这种假设在实际中显然是不合理的, 往往我们只有少量的数据.

10.1 Identification versus estimation

即使样本很多的一致性estimator也有可能离其正确的值相差很远.

另外, 这一节还提了提Wald confidence.

似乎用的就是一般的大样本的区间估计, 就是:

\[\frac{\bar{X} - \mu}{\sigma} \sim \mathcal{N} (0, 1).
\]

对于伯努利的情况,

\[\mu = p, \sigma = \sqrt{\frac{p(1-p)}{n}}.
\]

10.2 Estimation of causal effects

10.3 The myth of the super-population

在我们估计类似上面讲的置信区间的时候,

randomness 有两个来源:

  1. 本章将的采样的随机性;
  2. 来自于不确定的conterfactuals.

实际上, 我们能这么估计置信区间的原因是, 这些样本的确来源于一个binomial分布.

但是实际上, 有可能是每一个样本有一个独立的概率分布\(p_i\), 然后我们最后所观测到的\(p\)是一个均值而已(好浮夸).

10.4 The conditionality "principle"

\[\mathrm{Var} (\bar{X}_1 - \bar{X}_2)=
\mathrm{Var} (\bar{X}_1) +
\mathrm{Var} (\bar{X}_2).
\]

在confounders并不多的时候, 选择adjust for这些confounders是一个不错的主意.

The curse of dimensionality

Fine Point

Honest confidence intervals

uniform, honest: 存在一个样本数量n, 能够确保95%置信区间在95%的实验中发生.

Uncertainty from systematic bias

除了采样的误差, 置信区间的随机性也有可能是confounding, selection, measurement这些系统偏置带来的.

Technical Point

Bias and consistency in statistical inference

consistent estimator:

\[\mathrm{Pr}_P [|\hat{\theta}_n- \theta(P)| > \epsilon] \rightarrow 0 \quad \mathrm{as} \: n \rightarrow \infty \: \mathrm{for} \: \mathrm{every} \: \epsilon > 0, P \in \mathcal{M}.
\]

A formal statement of the conditionality principle

Approximate ancillarity

不想看.

Comparison between adjusted and unadjusted estimators

Most researchers intuitively follow the extended conditionality principle

Can the curse of dimensionality be reversed

Chapter 10 Random Variability的更多相关文章

  1. 零元学Expression Blend 4 - Chapter 10 用实例了解布局容器系列-「StackPanel」

    原文:零元学Expression Blend 4 - Chapter 10 用实例了解布局容器系列-「StackPanel」 本系列将教大家以实做案例认识Blend 4 的布局容器,此章介绍的布局容器 ...

  2. Think Python - Chapter 10 - Lists

    10.1 A list is a sequenceLike a string, a list is a sequence of values. In a string, the values are ...

  3. 机器学习技法:10 Random Forest

    Roadmap Random Forest Algorithm Out-Of-Bag Estimate Feature Selection Random Forest in Action Summar ...

  4. Thinking in Java from Chapter 10

    From Thinking in Java 4th Edition 内部类 public class Parcel1 { class Contents { private int i = 11; pu ...

  5. 机器学习技法笔记:10 Random Forest

    Roadmap Random Forest Algorithm Out-Of-Bag Estimate Feature Selection Random Forest in Action Summar ...

  6. 深入理解计算机系统_3e 第十章家庭作业 CS:APP3e chapter 10 homework

    10.6 1.若成功打开"foo.txt": -->1.1若成功打开"baz.txt": 输出"4\n" -->1.2若未能成功 ...

  7. 《算法导论》 — Chapter 10 基本数据结构

    序 在本章中,要讨论如何通过使用了指针的简单数据结构表示动态集合.有很多的复杂的数据结构可以用指针来构造,本章介绍几种基本数据结构,包括栈.队列.链表,以及有根树. GitHub 第十章 程序实现代码 ...

  8. Chapter 10 EF 6 Support

    http://dev.mysql.com/doc/connector-net/en/connector-net-entityframework60.html

  9. C++ Primer 随笔 Chapter 10 关联容器

    1.关联容器的类型:map(键-值对的集合,可理解为关联数组), set(单纯的键的集合), multimap(一个键对应多个值,键唯一), multiset(相同键可以是多个). 2.pair类型提 ...

随机推荐

  1. linux 6.5 网卡

    启动网卡 ifup eth0 eth0:网卡名称 设置网卡开机启动 vi /etc/sysconfig/network-scripts/ifcfg-eth0 ONBOOT=yes

  2. [MySQL实战-Mysql基础篇]-mysql架构

    1.基本组成 下面是mysql的基本架构示意图  图一 图二 我们可以从图上看出,mysql大体分为两个部分,一个是server层,另一个是引擎层. server层中包含了连接器.查询缓存.分析器.优 ...

  3. Flutter 中如何优雅的实现多渠道打包(埋点统计系列)

    我是 Zero,脑图先奉上 先赞后看,更新永不断 只要你关注 Flutter,这篇文章你绝对用得着,==> 强烈建议收藏 多渠道打包介绍 多渠道打包的主要作用是满足产品的运营需求,统计渠道和活动 ...

  4. IOS学习路径

    iOS Developer Roadmap Start your journey today! Where Do I Start? Becoming an iOS developer is a lot ...

  5. [BUUCTF]PWN14——not_the_same_3dsctf_2016

    [BUUCTF]PWN14--not_the_same_3dsctf_2016 题目网址:https://buuoj.cn/challenges#not_the_same_3dsctf_2016 步骤 ...

  6. CF1438A Specific Tastes of Andre 题解

    Content 如果一个序列的和能够被它的长度整除,我们称这个序列是不错的.如果一个序列的所有的非空子序列都是不错的,我们就称这个序列是完美的.现在有 \(t\) 组询问,每组询问给定一个整数 \(n ...

  7. shell判断新字符串列表是否在老字符串列表中

    for sn in `cat 12.30-new`;do if ! [[ `cat 12.30-old` =~ $sn ]];then echo $sn; fi; done

  8. python执行命令行调试工具pdb

    调试 pdb pdb是基于命令行的调试工具,非常类似gnu的gdb(调试c/c++). 命令 简写命令 作用 break b 设置断点(用法,b <数字>:在第数字行设置断点....... ...

  9. Django modules模块

    http://www.cnblogs.com/wupeiqi/articles/5246483.html

  10. MySQL查找数据中相同的数据,并进行删除

    查找表中多余的重复记录,重复记录是根据某个字段来判断 select * from 表名 where 字段 in (select 字段 from 表名 group by 字段 having count( ...