SPSS数据分析—混合线性模型

之前介绍过的基于线性模型的方差分析，虽然扩展了方差分析的领域，但是并没有突破方差分析三个原有的假设条件，即正态性、方差齐性和独立性，这其中独立性要求较严格，我们知道方差分析的基本思想其实就是细分，将所有对因变量产生影响的因素逐一摘出，但是如果各观测值之间相互影响，这样在细分影响因素的时候，是很难分出到底是自变量的影响还是观测值之间自己的影响。虽然随机抽样会最大程度的使数据满足独立性，但是有时候这种方法并不奏效，比如随机抽取受访者分析其消费特征，这里就假定所有受访者的之间是相互独立的，然而仔细想想，这其中存在问题，如果某些受访者来自同一个城市或地区，从个体角度讲，他们确实是独立的人，之间没有任何联系，但是如果从分析目的角度讲，由于区域因素他们之间的消费特征是趋于相似的，而产生这种相似性，正是由于相互作用导致，这些人是存在相互影响关系的，也就类以于相关样本，与此同时，这种相互作用也使得不同城市间的消费特征产生差异，我们称这种数据为具有层次聚集性的数据。数据的聚集性除了表现在聚集因素间指标的均值水平不同外，还表现在不同城市间的指标离散度上。

从层次聚集性数据也可以看出，随机抽样只能保证数据被抽到的概率相同，但是对于抽到的是什么样的数据，却无法控制了。对于这种具有层次结构的数据，如果分析目的仅限于这几种层次，比如就分析这几个城市，那么可以把它当做一种固定因子，只分析固定效应而不用考虑这种聚集性，但是如果想把结果推广到所有城市，那就不能忽略这种特征，否则会降低结果的准确性，因此还要加入随机效应。

混合线性模型就是同时包含固定效应和随机效应的线性模型，是解决此类层次聚集性数据的方法之一，对于具有层次结构的数据，我们需要将使观测值之间产生相互影响的层次因素也摘出来，比如上述中的城市因素，传统的方差分析模型中，将所有无法解释的因素都归在随机误差中，而随着我们对传统方差模型的不断拓展，对随机误差的分解也越来越精细，结果也越来越准确。

【例】我们想分析哪些因素会对16岁时毕业成绩的影响，显然毕业成绩和学校有关，好学校的学生成绩会好一些，而差学校的学生成绩会差一些，那么学校这个因素就是上述的层次因素，它使得因变量产生相关性，而且我们是想把结果推广到所有学校，因此学校这个变量应该被定为随机变量，我们首先按照一般线性模型来分析，不考虑层次因素

分析—一般线性模型—单变量

在按照一般线性模型分析之后，我们再来看看按照混合线性模型分析的结果会有什么不同

分析—混合模型—线性

经过以上分析，我们知道学校确实是一个层次聚集因素，不能按照一般线性模型进行分析，那么影响16岁考试成绩的原因有很多，我们继续加入变量进行分析。
首先加入11岁时的入学成绩，先将其加入固定因素，并观测和之前不加人任何因子相比有何变化

通过以上分析，我们看到，在固定因素中加入入学成绩这个变量以后，对于层次聚集性起到了减弱的效果，但是该影响仍然存在，说明还需要引入其他变量以完善模型，之前讲过，数据聚集性除了表现在聚集因素间指标的均值水平不同外，还表现在不同聚集因素间的指标离散度上，我们现在将11岁时的入学成绩这个变量加入随机因素中。

在将11岁毕业成绩引入到随机效应之后，层次聚集性又进一步减弱了，实际上我们可以不断的引入变量，这样最终层次聚集性就会消失，下面我们再来引入性别、学校类型、各学校学生在11岁入学时的平均成这三个变量。

根据以上思路，我们可以继续将变量引入随机效应、或者分析变量间的交互作用等，对数据进行更进一步的分析。

SPSS数据分析—混合线性模型的更多相关文章

SPSS数据分析—广义线性模型
我们前面介绍的一般线性模型.Logistic回归模型.对数线性模型.Poisson回归模型等,实际上均属于广义线性模型的范畴,广义线性模型包含的范围非常广泛,原因在于其对于因变量.因变量的概率分布等 ...
SPSS数据分析—对数线性模型
我们之前讲Logistic回归模型的时候说过,分类数据在使用卡方检验的时候,当分类过多或者每个类别的水平数过多时,单元格会划分的非常细,有可能会导致大量单元格频数很小甚至为0,并且卡方检验虽然可以分析 ...
混合线性模型(linear mixed models)
一般线性模型.混合线性模型.广义线性模型广义线性模型GLM很简单,举个例子,药物的疗效和服用药物的剂量有关.这个相关性可能是多种多样的,可能是简单线性关系(发烧时吃一片药退烧0.1度,两片药退烧0. ...
SPSS数据分析方法不知道如何选择
一提到数学,高等数学,线性代数,概率论与数理统计,数值分析,空间解析几何这些数学课程,头疼呀.作为文科生,遇见这些课程时,通常都是各种寻求帮助,班上有位宅男数学很厉害,各种被女生‘围观’,这数学为 ...
快速掌握SPSS数据分析
SPSS难吗?无非就是数据类型的区别后,就能理解应该用什么样的分析方法,对应着分析方法无非是找一些参考资料进行即可.甚至在线网页SPSS软件直接可以将数据分析结果指标人工智能地分析出来,这有多难呢 ...
SPSS数据分析—广义线性混合模型
广义线性混合模型是目前线性模型范畴内最为完备的模型框架,它是广义线性模型的进一步延伸,进一步突破适用条件,因变量既可以非正态,也可以非独立,由于其最为复杂,因此SPSS对其输出结果采用模型格式,而不 ...
SPSS数据分析—二分类Logistic回归模型
对于分类变量,我们知道通常使用卡方检验,但卡方检验仅能分析因素的作用,无法继续分析其作用大小和方向,并且当因素水平过多时,单元格被划分的越来越细,频数有可能为0,导致结果不准确,最重要的是卡方检验不能 ...
SPSS数据分析—生存分析
生存分析是对生存时间进行统计分析的一种技术,所谓生存时间,就是指从某一时间点起到所关心的事件发生的这段时间.这里的时间不一定就是钟表日历上的时间,也有可能是其他的度量单位,比如长度单位等. 生存时间有 ...
SPSS数据分析—多维尺度分析
在市场研究中,有一种分析是研究消费者态度或偏好,收集的数据是某些对象的评分数据,这些评分数据可以看做是对象间相似性或差异性的表现,也就是一种距离,距离近的差异性小,距离远的差异性大.而我们的分析目的也 ...

随机推荐

MVC项目实践,在三层架构下实现SportsStore,从类图看三层架构
在"MVC项目实践,在三层架构下实现SportsStore-02,DbSession层.BLL层"一文的评论中,博友浪花一朵朵建议用类图来理解本项目的三层架构.于是就有了本篇: I ...
变量在SSIS包中的使用
2010~2011年经常使用SSIS包采集加工数据,后来换了工作就很少使用.最近又开始用那玩意采集数据,努力回想之前是怎样操作的,网上各种找各种纠结.趁这次使用记录下日常操作步骤,以备以后不时之需. ...
LUA 函数式编程demo
什么是函数式编程 http://www.zhihu.com/topic/19585411/hot 函数式编程的本质函数式编程中的函数这个术语不是指计算机中的函数(实际上是Subroutine),而是指 ...
lnmp环境下载安装包
一.下载php(官网):http://php.net/downloads.php 点击上图选择的php-7.0.10.tar.gz (sig) 进入如下页面: 需要在linux上面下载需要如下操作: ...
Hadoop+Spark:集群环境搭建
环境准备: 在虚拟机下,大家三台Linux ubuntu 14.04 server x64 系统(下载地址:http://releases.ubuntu.com/14.04.2/ubuntu-14.0 ...
sql server 中删除表中数据truncate和delete的区别(转载自.net学习网)
我们都知道truncate table可以用来删除整个表的内容,它与delete后面不跟where条件的效果是一样.但除此之外,我们还清楚它们之间有其它的区别吗?本章我们将一起讨论truncate与d ...
Leetcode: 4Sum II
Given four lists A, B, C, D of integer values, compute how many tuples (i, j, k, l) there are such t ...
SqlServer分区表概述（转载）
什么是分区表一般情况下,我们建立数据库表时,表数据都存放在一个文件里. 但是如果是分区表的话,表数据就会按照你指定的规则分放到不同的文件里,把一个大的数据文件拆分为多个小文件,还可以把这些小文件放在 ...
如何用css做一个细虚线边框表格
<style type="text/css"> <!-- .dashed_tbl { border-top: 1px dashed #333333; border ...
iconfont-矢量图标字体的运用
发现一个奇怪的现象:(http://m.muzhiwan.com) 这里面的图标竟然不是一张张小图标图片?Firebug下查看一下元素,竟然是这样的: 页面源代码如下: 好奇怪啊,这些个乱七八糟的&a ...

SPSS数据分析—混合线性模型

SPSS数据分析—混合线性模型的更多相关文章

随机推荐

热门专题