之前介绍过的基于线性模型的方差分析,虽然扩展了方差分析的领域,但是并没有突破方差分析三个原有的假设条件,即正态性、方差齐性和独立性,这其中独立性要求较严格,我们知道方差分析的基本思想其实就是细分,将所有对因变量产生影响的因素逐一摘出,但是如果各观测值之间相互影响,这样在细分影响因素的时候,是很难分出到底是自变量的影响还是观测值之间自己的影响。虽然随机抽样会最大程度的使数据满足独立性,但是有时候这种方法并不奏效,比如随机抽取受访者分析其消费特征,这里就假定所有受访者的之间是相互独立的,然而仔细想想,这其中存在问题,如果某些受访者来自同一个城市或地区,从个体角度讲,他们确实是独立的人,之间没有任何联系,但是如果从分析目的角度讲,由于区域因素他们之间的消费特征是趋于相似的,而产生这种相似性,正是由于相互作用导致,这些人是存在相互影响关系的,也就类以于相关样本,与此同时,这种相互作用也使得不同城市间的消费特征产生差异,我们称这种数据为具有层次聚集性的数据。数据的聚集性除了表现在聚集因素间指标的均值水平不同外,还表现在不同城市间的指标离散度上。

从层次聚集性数据也可以看出,随机抽样只能保证数据被抽到的概率相同,但是对于抽到的是什么样的数据,却无法控制了。对于这种具有层次结构的数据,如果分析目的仅限于这几种层次,比如就分析这几个城市,那么可以把它当做一种固定因子,只分析固定效应而不用考虑这种聚集性,但是如果想把结果推广到所有城市,那就不能忽略这种特征,否则会降低结果的准确性,因此还要加入随机效应。

混合线性模型就是同时包含固定效应和随机效应的线性模型,是解决此类层次聚集性数据的方法之一,对于具有层次结构的数据,我们需要将使观测值之间产生相互影响的层次因素也摘出来,比如上述中的城市因素,传统的方差分析模型中,将所有无法解释的因素都归在随机误差中,而随着我们对传统方差模型的不断拓展,对随机误差的分解也越来越精细,结果也越来越准确。

【例】我们想分析哪些因素会对16岁时毕业成绩的影响,显然毕业成绩和学校有关,好学校的学生成绩会好一些,而差学校的学生成绩会差一些,那么学校这个因素就是上述的层次因素,它使得因变量产生相关性,而且我们是想把结果推广到所有学校,因此学校这个变量应该被定为随机变量,我们首先按照一般线性模型来分析,不考虑层次因素

分析—一般线性模型—单变量


在按照一般线性模型分析之后,我们再来看看按照混合线性模型分析的结果会有什么不同

分析—混合模型—线性





经过以上分析,我们知道学校确实是一个层次聚集因素,不能按照一般线性模型进行分析,那么影响16岁考试成绩的原因有很多,我们继续加入变量进行分析。
首先加入11岁时的入学成绩,先将其加入固定因素,并观测和之前不加人任何因子相比有何变化



通过以上分析,我们看到,在固定因素中加入入学成绩这个变量以后,对于层次聚集性起到了减弱的效果,但是该影响仍然存在,说明还需要引入其他变量以完善模型,之前讲过,数据聚集性除了表现在聚集因素间指标的均值水平不同外,还表现在不同聚集因素间的指标离散度上,我们现在将11岁时的入学成绩这个变量加入随机因素中。

在将11岁毕业成绩引入到随机效应之后,层次聚集性又进一步减弱了,实际上我们可以不断的引入变量,这样最终层次聚集性就会消失,下面我们再来引入性别、学校类型、各学校学生在11岁入学时的平均成这三个变量。



根据以上思路,我们可以继续将变量引入随机效应、或者分析变量间的交互作用等,对数据进行更进一步的分析。

SPSS数据分析—混合线性模型的更多相关文章

  1. SPSS数据分析—广义线性模型

    我们前面介绍的一般线性模型.Logistic回归模型.对数线性模型.Poisson回归模型等,实际上均属于广义线性模型的范畴,广义 线性模型包含的范围非常广泛,原因在于其对于因变量.因变量的概率分布等 ...

  2. SPSS数据分析—对数线性模型

    我们之前讲Logistic回归模型的时候说过,分类数据在使用卡方检验的时候,当分类过多或者每个类别的水平数过多时,单元格会划分的非常细,有可能会导致大量单元格频数很小甚至为0,并且卡方检验虽然可以分析 ...

  3. 混合线性模型(linear mixed models)

    一般线性模型.混合线性模型.广义线性模型 广义线性模型GLM很简单,举个例子,药物的疗效和服用药物的剂量有关.这个相关性可能是多种多样的,可能是简单线性关系(发烧时吃一片药退烧0.1度,两片药退烧0. ...

  4. SPSS数据分析方法不知道如何选择

      一提到数学,高等数学,线性代数,概率论与数理统计,数值分析,空间解析几何这些数学课程,头疼呀.作为文科生,遇见这些课程时,通常都是各种寻求帮助,班上有位宅男数学很厉害,各种被女生‘围观’,这数学为 ...

  5. 快速掌握SPSS数据分析

      SPSS难吗?无非就是数据类型的区别后,就能理解应该用什么样的分析方法,对应着分析方法无非是找一些参考资料进行即可.甚至在线网页SPSS软件直接可以将数据分析结果指标人工智能地分析出来,这有多难呢 ...

  6. SPSS数据分析—广义线性混合模型

    广义线性混合模型是目前线性模型范畴内最为完备的模型框架,它是广义线性模型的进一步延伸,进一步突破适用条件,因变量既 可以非正态,也可以非独立,由于其最为复杂,因此SPSS对其输出结果采用模型格式,而不 ...

  7. SPSS数据分析—二分类Logistic回归模型

    对于分类变量,我们知道通常使用卡方检验,但卡方检验仅能分析因素的作用,无法继续分析其作用大小和方向,并且当因素水平过多时,单元格被划分的越来越细,频数有可能为0,导致结果不准确,最重要的是卡方检验不能 ...

  8. SPSS数据分析—生存分析

    生存分析是对生存时间进行统计分析的一种技术,所谓生存时间,就是指从某一时间点起到所关心的事件发生的这段时间.这里的时间不一定就是钟表日历上的时间,也有可能是其他的度量单位,比如长度单位等. 生存时间有 ...

  9. SPSS数据分析—多维尺度分析

    在市场研究中,有一种分析是研究消费者态度或偏好,收集的数据是某些对象的评分数据,这些评分数据可以看做是对象间相似性或差异性的表现,也就是一种距离,距离近的差异性小,距离远的差异性大.而我们的分析目的也 ...

随机推荐

  1. thinkphp多语言设置

    thinkphp多语言设置有点'高大上',为什么说它有点'高大上'呢?因为本人设置了好久才弄好,而本人之所以弄了好久的原因,竟然是因为'开启语言设置必须得先开启初始化系统的行为类',所以,在这里,因为 ...

  2. .net mvc onexception capture; redirectresult;

    need to set filtercontext.result=new redirectresult('linkcustompage'); done. so... ASP.NET MVC异常处理模块 ...

  3. Xamarin 编程之打电话

    参考:http://www.cnblogs.com/yaozhenfa/ Main.axml <?xml version="1.0" encoding="utf-8 ...

  4. SQL批量添加主键脚本

    --SQL批量添加主键脚本 --操作提示:运行此脚本前请记得备份您要操作的数据库 --实现功能:执行脚本后数据库中的所有数据表都会有一个主键 --添加规则1:主键名称为ID(可自己修改),数据类型为整 ...

  5. StructureMap使用方法(转)

    终于到了题目中的MVC使用StructureMap依赖注入的配置与实现了.在ASP.Net三层架构应用中StructureMap的是最老的IOC/DI工具,也就是依赖注入,很多线上的项目都使用了Str ...

  6. HTML5新增元素、标签总结

    总是遇到h5新标签的笔试题目,就查阅了资料来总结一下: 1.form相关: (1)form属性:在HTML5中表单元素可放在表单之外,通过给该元素添加form属性来指向目标表单(form属性值设为目标 ...

  7. [Scrapy] Mac安装Scrapy

    Mac安装Scrapy Mac版本 10.11 El Captain. 前一段想在Mac上用Scrapy,各种问题.有一个不错的工具:Anaconda. 安装Anaconda 下载地址 我还是下pyt ...

  8. 【宽度优先搜索】神奇的状态压缩 CodeVs1004四子连棋

    一.写在前面 其实这是一道大水题,而且还出在了数据最水的OJ上,所以实际上这题并没有什么难度.博主写这篇blog主要是想写下一个想法--状态压缩.状态压缩在记录.修改状态以及判重去重等方面有着极高的( ...

  9. Android 对电话进行监听和挂断

    1.添加权限 <!--拨打电话的权限--><uses-permission android:name="android.permission.PROCESS_OUTGOIN ...

  10. 类函数和对象函数 PHP

    1. bool class_exists ( string $class_name [, bool $autoload = true ] )  检查指定的类是否已定义. 如果由 class_name  ...