数据分析 - 斯特鲁普效应(Stroop effect)

Reinhard得到了一份斯特鲁普效应试验的数据,我们来分析下,文字的颜色,是否会影响受试者的反应。
这里先看看什么是斯特鲁普效应:

斯特鲁普效应(Stroop effect)是指在心理学中干扰对反应时间影响的实验。这是1935年实验心理学家史楚普(John Ridley Stroop)所提出的著名的发现之一,指出环境刺激物理的各项特征,如果相融,则会使辨识加速,反应时间缩短;但若互不相融,则会造成干扰,使反应时间拉长。例如当测试者被要求说出某个颜色和其字面意义不符的词语时,被测者往往会反应速度下降,出错率上升。

我们再来来看看下面这个例子:
尽可能以最快的速度说出下面两组文字的颜色
- - -
绿色 红色 蓝色
黄色 蓝色 黄色
- - -
蓝色 黄色 红色
绿色 黄色 绿色
- - -

参考文献

Stroop Effect - Wikipedia

变量

  • 自变量是文字与颜色是否匹配
  • 因变量是受试者的反应时间

假设

适当的假设是,当文字和颜色匹配时,受试者所花费的反应时间要更少。

这里,零假设是,文字和颜色的匹配与不匹配,对受试者而言在反应时间上没有差别。
对立假设是,文字和颜色匹配时,受试者的反应时间上比不匹配时更少。

这里,用\(H_0\)表示零假设,用\(H_A\)表示对立假设。用\(\mu_C\)表示文字与颜色匹配的总体的均值。用\(\mu_I\)表示文字与颜色不匹配的总体的均值。

\(H_0:\mu_C=\mu_I\)
\(H_A:\mu_C<\mu_I\)

统计测试类型

z-test适用于知道总体参数(如\(\mu,\sigma\))的情况。
这里,我们并不知道总体参数。我们只有样本,需要比较两个样本之间的区别,并以此来推断总体的情况,所以需要使用t-test。

由数据集的描述可以得知,这是一组受试者参加两次测试所得到的两个样本,也就是相依样本。
在相依样本t检验的测试类型中,有一种叫做重复衡量设计,是在试验中对同一名受试者进行不同的测试。

这里,将采用负方向的单尾检验。
因为我们的对立假设是文字和颜色匹配时,受试者的反应时间少。所以检验必须具有方向行,不能使用双尾检验,只能使用单尾检验。从我们对立假设\(\mu_C-\mu_I<0\)可以得知,检测的方向是负方向。

样本数据可视化

直方图

从两个样本数据的直方图上我们可以看出,
文字与颜色匹配的反应时间,大多集中在11到18之间。
文字与颜色不匹配的反应时间,大多集中在17到23之间。

箱线图

从箱线图中可以看出,
文字与颜色匹配的样本中,最大值和最小值差较大,但是四分位差较小。
文字与颜色不匹配的样本中,最大和最小值差较小,但是四分位差较大,而且有异常点存在。

数据集的统计描述

反应前后二者平均值之间的差别

\(\bar{x}=\bar{x}_C-\bar{x}_I=-7.96\)

标准偏差

\(S_D=\sqrt{\frac{\sum{(x_i-\bar{x})^2}}{n-1}}=4.86\)

标准误差

\(SEM=\frac{S_D}{\sqrt{n}}=\frac{4.86}{\sqrt{24}}=0.99\)

t统计量

\(t-statistic=\frac{\bar{x}_C-\bar{x}_I}{SEM}=\frac{-7.96}{0.99}=-8.04\)

t临界值

这里使用\(\alpha级别为0.05\)的单尾检验,自由度是23,t临界值是-1.714

效应量\(r^2\)

\(r^2=\frac{t^2}{t^2+df}=0.74\)

\(r^2=.74\)
也就是74%的差异,是由文字和颜色匹配与不匹配所造成的。

置信区间

自由度是23,95%置信区间的t临界值是2.069,误差界限是\(t-critical * SEM=2.069 * 0.99=2.05\)
置信区间\(CI:\bar{x}_D\pm 2.05=-7.96\pm 2.05=(-10.01,-5.91)\)

关于均值差异的置信区间;95% CI=(-10.01,-5.91)

决策

\(t(23)=-8.04,P<.05,one-tailed\)
根据t统计量和t临界值,Reinhard认为结果有统计上的显著性。
因为P<0.05,所以Reinhard拒绝零假设。
试验证明在文字和颜色匹配时,受试者的反应时间比不匹配时更少。

数据分析 - 斯特鲁普效应(Stroop effect)的更多相关文章

  1. Survey Report on Data Skew in Big Data

    1 Introduction 信息时代产生了大量的数据,运用和使用数据已经成为一个公司乃至一个国家核心实力的重要组成部分.当代大数据一般指的是:数据量巨大,需要运用新处理模式才能具有更强的决策力.洞察 ...

  2. P2P公司是如何进行风险管理的

    关于P2P的风控很多人仍然是一知半解,甚至不少长期P2P圈内的资深玩家对此也是“既没吃过猪肉,也没见过猪跑”.   但是不可否认的是,作为一种跳过银行间接贷款融资模式的.一种在借款人和出借人之间直接发 ...

  3. JAVA开发搞了一年多的大数据,究竟干了点啥

    JAVA开发搞了一年多大数据的总结 ​ 2021年7月份加入了当前项目组,以一个原汁原味的Java开发工程师的身份进来的,来了没多久,项目组唯一一名大数据开发工程师要离职了,一时间一大堆的数据需求急需 ...

  4. 使用limma、Glimma和edgeR,RNA-seq数据分析易如反掌

    使用limma.Glimma和edgeR,RNA-seq数据分析易如反掌 Charity Law1, Monther Alhamdoosh2, Shian Su3, Xueyi Dong3, Luyi ...

  5. Python——气象数据分析

    将对意大利北部沿海地区的气象数据进行分析与可视化.我们在实验过程中先会运用 Python 中 matplotlib 库的对数据进行图表化处理,然后调用 scikit-learn 库当中的的 SVM 库 ...

  6. 使用Kylin构建企业大数据分析平台的4种部署方式

    本篇博客重点介绍如何使用Kylin来构建大数据分析平台.根据官网介绍,其实部署Kylin非常简单,称为非侵入式安装,也就是不需要去修改已有的 Hadoop大数据平台.你只需要根据的环境下载适合的Kyl ...

  7. 【转帖】Python在大数据分析及机器学习中的兵器谱

    Flask:Python系的轻量级Web框架. 1. 网页爬虫工具集 Scrapy 推荐大牛pluskid早年的一篇文章:<Scrapy 轻松定制网络爬虫> Beautiful Soup ...

  8. 0-Spark高级数据分析-读书笔记

    学完了<Spark快速大数据分析>,对Spark有了一些了解,计划更近一步,开始学习<Spark高级数据分析>.这本书是用Scala写的,在学习的过程中想把其中的代码转换成Ja ...

  9. 【转】使用Apache Kylin搭建企业级开源大数据分析平台

    http://www.thebigdata.cn/JieJueFangAn/30143.html 本篇文章整理自史少锋4月23日在『1024大数据技术峰会』上的分享实录:使用Apache Kylin搭 ...

随机推荐

  1. 引用dll动态库,动态库中弹出对话框输入,将输入参数,作为变量继续调用。

    在做支付项目时,引用动态库,动态库弹出支付宝或者微信的支付码,继而接收.最终将结果返回给调用动态库方法. 首先,动态库接收的是一个string 类型的xml,如 public string Pay(s ...

  2. JBoss QuickStart之Helloworld

    下载Jboss, quickstart, 按照quickstart说明, mvn clean install. 由于ssl handshake问题(应该是网络连接不稳定), 写了一个脚本不停地尝试bu ...

  3. Nodejs:Glob对象

    模块Glob: glob主要用处为筛选文件 API样例: var globInstance = new glob.Glob("@(a|a1|b).js",{nonull:true, ...

  4. PHP和HTML代码混合编译的三种方法

    第一种是在HTML中加PHP. 大段大段的html代码中,在各个需要执行php的地方<?php .... ?> 比如 line7-9: 1 <head> 2 <meta ...

  5. PHP preg_replace使用例子

    将 qwer://xxx/545/0 替换为 qwer://trading_system_xxx/0/545 $str = '<a href="qwer://xxx/545/0&quo ...

  6. django url.py使用

    主要对象:patterns和url url有两个主要的参数,第一个是正则模板,第二个是处理的方法 他们的对应关系是,当我们在浏览器当中url的形式与正则相匹配时 就转向处理方法 如果url.py中的值 ...

  7. CentOS7 配置网卡端口镜像

    背景 最近一直在研究旁路监测,需要设置一个源端口镜像给两个目的端口(分别接两个监测设备),无奈ip-com交换机没配置明白,研究下使用软件实现暂时代替. 环境 发行版.内核.iptables版本信息如 ...

  8. 可爱的Python_课后习题_CDay−4 可用的首个Python 脚本

    读取文件cdays−4-test.txt 内容,去除空行和注释行后,以行为单位进行排序,并将结果输出为cdays−4-result.txt. cdays−4-test.txt的内容 #some wor ...

  9. python成长之路-----day1----笔记(1)

    1.python语言介绍 python的创始人:Guido Van Rossum 2.python是一门什么样的语言 编程语言主要从以下几个角度进行分类:编译型,静态型,动态性,强类型定义语言和弱类型 ...

  10. 【转】Deadlock的一些总结(死锁分析及处理)

    1.1.1 摘要 在系统设计过程中,系统的稳定性.响应速度和读写速度至关重要,就像12306.cn那样,当然我们可以通过提高系统并发能力来提高系统性能总体性能,但在并发作用下也会出现一些问题,例如死锁 ...