格兰杰因果关系(Granger causality )是基于预测的因果关系统计概念。根据格兰杰因果关系,如果信号X1“格兰杰Causes”(或“G-Causes”)信号X2,则X1的过去值应该包含有助于预测X2的信息,并且超过仅包含在X2的过去值中的信息。其数学公式基于随机过程的线性回归模型(Granger 1969)。当然也有对非线性情况的扩展,但是这些扩展在实践中通常更难以应用。

格兰杰因果关系(或“G因果关系”)于20世纪60年代发展起来,自那以来,已广泛应用于经济学。然而,仅仅在过去的几年里,神经科学的应用开始流行起来。

个人解释by Clive Granger

关于如何定义因果关系的话题让哲学家们忙了两千多年,但是现在都还没有得到解决。这是一个令人深思的问题,有许多种答案试图解释因果关系,但都并不能使所有人信服,它仍然具有一定的挑战性。研究者希望,如果他们认为已经找到了一个“原因”,这应该是一个深刻的基本关系,并且拥有potential。

在20世纪60年代早期,我(Clive Granger)正在考虑一对明显相互关联的随机过程,我想知道这种关系是否可以分解为一对单向关系。有人建议我看一下非常着名的数学家Norbert Weiner提出的因果关系的定义,所以我将这个定义(Wiener 1956)改编成实用的形式并进行了讨论。

应用经济学家发现这个定义便于理解和应用,并且它的具体应用开始出现。但是,有几位作者表示,“当然,这不是真正的因果关系,它只是格兰杰因果关系。”因此,从一开始,在实际应用中,使用Granger Causality这个术语来区别于其他定义。

基本的“Granger因果关系”定义非常简单。假设我们有三项XtYtWt,并且我们首先尝试使用过去的XtWt项来预测Xt+1。然后我们尝试使用过去的XtYtWt来预测Xt+1。如果根据标准成本函数,发现第二个预测更成功,那么Y的过去似乎包含有助于预测Xt+1的信息,这些信息并不包含在过去的XtWt。特别是,向量Wt可能是一个可解释的变量。因此,Yt会“格兰杰导致”Xt+1,如果(a)Yt出现在Xt+1之前; 并且(b)它包含能够预测Xt+1中有用的信息,这些信息在其他合适的变量中找不到。

当然,Wt越大,选择的内容就越仔细,Yt越严格。最终,Yt可能似乎包含有关Xt+1的独特信息,这在其他变量中找不到,这就是为什么“因果关系”标签可能是合适的。

这个定义很大程度上依赖于原因cause出现在效应effect之前,这是大多数因果关系定义的基础,但并不是全部。一些含义是Yt可能导致Xt+1Xt导致Yt+1,相当于是一个反馈随机系统。但是,对于确定性过程(例如指数趋势)是不可能是casuse或者caused by另一个变量。

人们普遍认为,虽然它不能涵盖因果关系的所有方面,但足以在实际测试中得以应用。

Mathematical formulation

G-因果关系通常在线性回归模型的背景下进行测试。为了说明,考虑两个变量X1X2二元线性自回归模型:

其中p是包含在模型中的滞后观测值的最大数量(模型阶数),矩阵A包含模型的系数(即,每个滞后观测值对X1(t)X2(t)的贡献,E1E2是每个时间序列的残差(预测误差)。 在第一(或第二)方程中包含X2(或X1),如果E1(或E2)的方差降低了,则称X2(或X1) Granger-(G)-causes X1(或X2)。换句话说,如果A12中的系数与0显著不同,X2 G-引起X1。这可以通过F-test, 根据0假设A12 = 0,假设X1X2协方差平稳,G因果互作用的大小可以用相应的F统计量的对数来估计(Geweke 1982)。 实际中要注意模型选择标准,如贝叶斯信息标准(BIC,(Schwartz 1978))或Akaike信息标准(AIC,(Akaike 1974))可以用来确定合适的模型阶数p

正如上面所述,G因果关系可以很容易地扩展到n变量的情况,其中n> 2,估计一个n变量自回归模型。在这种情况下,如果X2的滞后观测值有助于预测X1时,并且同时也考虑到所有其他变量X3 ... XN的滞后观测值,那么X2 G-将导致X1。 (这里,'X3 ... XN对应于上一节中集合W中的变量; 另请参阅Boudjellaba et al。(1992)关于使用自回归移动平均(ARMA)模型的解释。)此多变量扩展版本,有时被称为'条件'G因果关系(Ding et al. 2006)是非常有用的,因为多个变量之间的重复配对分析有时会产生令人误解的结果。例如,重复的双变量分析将无法消除下图中两种连接模式的歧义。相比之下,条件/多变量分析将推断XY的因果关系,只要X中的过去信息有助于预测未来Y和超越beyond这些信号由Z为中介。另一个有价值的条件G因果关系例子: 单个信号源驱动两个具有不同时间延迟的输出。双变量分析,但不是多变量分析,会错误地推断出从较短延迟输出到较长延迟输出的因果联系。

Two possible connectivities that cannot be distinguished by pairwise analysis. Adapted from Ding et al. (2006).

上述G因果公式的应用对数据做出了两个重要假设:(i)它是协方差平稳的(即每个时间序列的均值和方差不随时间变化);(ii)它可以可以通过线性模型进行充分描述。

Spectral G-causality

通过傅里叶方法,可以检查谱Spectral域中的G因果关系(Geweke,1982; Kaminski等,2001)。这对于神经生理学信号非常有用,其中频率分解通常是比较有意思的。直观地说,从X1X2频谱G因果关系度量了在频率f处,X2贡献给X1的分数。

为了完整性,我们在下面给出了谱G因果关系的数学细节。 通过傅里叶变换可以得到,

矩阵A的元素为,

重新写原来的方程,

其中,

H称作为传递矩阵(transfer matrix),现在可以得到普矩阵S

*代表矩阵的共轭转置,Σ 是残差E(t)的协方差矩阵。 从节点ji的谱G-causality为,

其中Sii(f)是变量i在频率为f处的功率谱。 (该分析改编自(Brovelli等2004; Kaminski等2001))

Chen et al (2006)的工作指出,将Geweke提出的谱G因果关系应用于多变量(> 2)神经生理学时间序列有时会导致在某些频率处的因果关系,这是一个有点违背(evade)物理解释的结果。他们提出了修改后的Geweke度量的条件版本,它可以通过使用分块矩阵( partition matrix)方法来克服这个问题。 Breitung和Candelon(2006)和Hosoya(1991)讨论了谱G因果关系的其他版本。

谱G因果关系密切相关的两种方法是partial directed coherence(Baccala&Sameshima,2001)和 directed transfer function定向传递函数(Kaminski et al。2001;注意这些作者表明了定向传递函数谱G-因果关系之间的等价性)。对于这些方法之间的比较结果,参见Baccala和Sameshima(2001),Gourevitch等人(2006)和Pereda等人(2005年)。与G因果关系的原始时域公式不同,这些频谱测量的统计特性尚未完全阐明。这意味着显着性检验通常依赖于替代(surrogate)数据,并且信号预处理(例如,平滑,过滤)对测量因果关系的影响仍不清楚。

Limitations and extensions

Linearity

G因果关系的原始公式只能给出有关信号线性特征的信息。现在已经存在对非线性情况的扩展,但是这些扩展在实践中可能更难以使用,并且他们的统计特性不太清楚。在Freiwald等人的方法中。 (1999)将全球非线性数据分为局部线性邻域(参见Chen et al.2004),而Ancona et al。 (2004)使用径向基函数方法来执行全局非线性回归

Stationarity

G-因果关系的应用假定分析信号是协方差平稳的。假设非平稳信号的足够短的窗口局部平稳,可以通过使用窗口技​​术(Hesse et al.2003)来处理非平稳数据。一个相关的方法利用了许多神经生理学实验的试验性质(Ding等,2000)。在这种方法中,来自不同试验的时间序列被视为具有局部平稳段的非平稳随机过程的单独实现。

Dependence on observed variables

关于G因果关系的所有实现的一般评论是,它们完全依赖于适当的变量选择。显然,没有纳入回归模型的因果因素不能用来表示输出。因此,G-因果关系不应被解释为直接反映物理因果链。

格兰杰因果 Granger causality的更多相关文章

  1. 漫谈格兰杰因果关系(Granger Causality)——第一章 野火烧不尽,春风吹又生

    2017年7月9日上午6点10分,先师胡三清同志--新因果关系的提出者.植入式脑部电极癫痫治疗法的提出者.IEEE高级会员,因肺癌医治无效于杭州肿瘤医院去世,享年50岁.余蒙先师厚恩数载,一朝忽闻先师 ...

  2. Granger Causality 格兰杰因果关系

      (Granger Causality) 格兰杰(Granger)于 1969 年提出了一种基于“预测”的因果关系(格兰杰因果关系),后经西蒙斯(1972 ,1980)的发展,格兰杰因果检验作为一种 ...

  3. VAR向量自回归模型学习笔记2

    向量自回归模型 今天的你 和昨天的你 和前天的你,是否具有相关性. 1. 定义 向量自回归(VAR,Vector Auto regression)分析联合内生变量间的动态关系 联合:n个变量间的相互影 ...

  4. VAR模型学习笔记

    目录 1 定义 VAR模型的具体步骤 建模步骤及公式 代码实现 1 定义 VAR模型除了分析自身滞后项的影响外,还分析其他相关因素的滞后项对未来值产生的影响参考 用来分析随机扰动对系统的动态冲击的大小 ...

  5. 【2011图灵奖得主】我眼中的Judea Pearl

    [2011图灵奖得主]我眼中的Judea Pearl 来源: 叶星遥的日志 2011年的图灵奖花落UCLA计算机系的Judea Pearl教授.图灵奖是计算领域的最高奖,由于近年来这个领域的兴盛也算是 ...

  6. Econ 493 A1 - Fall 2019

    Econ 493 A1 - Fall 2019Homework 4Assignment InformationThis assignment is due on Monday November 18 ...

  7. VAR 学习笔记3

    脉冲响应图及方差分析 当使用VAR模型的时候需要完成: 选择合适的变量 就是研究变量这个没有疑问 判断滞后阶数 根据AIC和SC准则,选择 为何做格兰杰因果检验 如果给定 \(x_t\) 的滞后阶数, ...

  8. 给工程师的 10 条哲理(浅薄者迷信运气,强者相信因果,软件复制成本为零,文凭不重要,AWS使得创业成本为零,每个手机都是口袋里的强大电脑)

    无论是主题分布式数据库,微服务,Soylent,尤伯杯,或者矮人要塞,我们试图从物质分离出来炒作,推迟叙事的客人.与尊重有软件工程日报的社论部分客观性. 一位渠道的成员说,“当软件工程每日的意见公布, ...

  9. Convolution Network及其变种(反卷积、扩展卷积、因果卷积、图卷积)

    今天,主要和大家分享一下最近研究的卷积网络和它的一些变种. 首先,介绍一下基础的卷积网络. 通过PPT上的这个经典的动态图片可以很好的理解卷积的过程.图中蓝色的大矩阵是我们的输入,黄色的小矩阵是卷积核 ...

随机推荐

  1. 基于form表单的极验滑动验证小案例

    01.目录展示 02.url.py urlpatterns = [ path('admin/', admin.site.urls), path('login/',views.login), path( ...

  2. 如何使用Loadrunner Controller 监控服务器的系统资源

    (1)保证装有loadrunner Controller的控制机和被监控的目标机(服务器)之间能够ping通,在同一个网段内,保证两台机器用administrator登陆. (2)Win + R, s ...

  3. Linux_基础指令

    目录 目录 前言 cd和pwd ls cat du mkdir touch rm cp mv which whereis find ln head和tail wc tar vim useradd 添加 ...

  4. Python学习之==>迭代器

    一.概要 在了解Python的数据结构时,容器(container).可迭代对象(iterable).迭代器(iterator).生成器(generator).列表/集合/字典推导式(list,set ...

  5. centos中切换图形与命令行界面

    1.在命令行的centos中安装图形化 配置本地源 [root@localhost yum.repos.d]# yum clean all [root@localhost yum.repos.d]# ...

  6. 在Spring容器外调用bean

    这个东西源于这种需求:一个应用丢到服务其后,不管用户有没有访问项目,这个后台线程都必须给我跑,而且这个线程还调用了Spring注入的bean,这样自然就会想到去监听Servlet的状态,当Servle ...

  7. Appium - multiprocessing.pool.MaybeEncodingError-【 “Can’t pickle local object ‘PoolManager.__init__.<locals>.<lambda>‘】

    公司同事学习自动化新装环境后,run多进程测试用例时出错: multiprocessing.pool.MaybeEncodingError: Error sending result: ’<ap ...

  8. python-unittest模块中的各类断言

    unittest中断言主要有三种类型: 基本的布尔断言,即:要么正确,要么错误的验证 比较断言,如比较两个变量的值(跟上面的布尔断言区别不大,主要是通过比较两个变量的值得出布尔值) 复杂断言(一般用的 ...

  9. 接口自动化-python unittest+requests+HTMLrunner

    从2015年毕业入行软件测试,快满4年了,之前技术分享都在百度贴吧上面,现在正式开始在博客中记录工作技术,努力成长,加油 接口测试的步骤1.组装好该接口需要的参数数据2.使用get或post附带参数数 ...

  10. mysql 关键字大全

    mysql无论表名,还是字段名都应该避开mysql关键字. 如字段使用关键字,sql查询需加上` `.   查询插件,当使用关键字,会报错. usage