本文章为SPSSAU数据分析思维培养的第3期文章。

上文讲解如何选择正确的分析方法,除了有正确的分析方法外,还需要把分析方法进行灵活运用。拿到一份数据,应该如何进行分析,总共有几个步骤,第一步第二步应该做什么,需要有个宏观把控,只有这样才能有规范的研究科学的思维和逻辑。

 

本文章首先阐述数据的整体思维,即整体把控住应该如何剖析一份数据做到心理有数,接着针对常见的问卷进行思维剖析,并且提供思路框架,期许为大家带来一丝丝帮助。

第一部分 把控数据思维

如果想要把控好数据思维,简单来讲在拿到一份数据后如何进行分析,心里应该有个底。做到以下几点,相信可以更好地理解数据思维。首先是针对数据特征描述,其次是对数据质量说明,研究目的是什么如何使用研究方法或措施去匹配论证研究目的,最后把数据结果呈现出来并且进行讨论说明。

1、数据特征描述

拿到一份数据时,首先看下数据的特征,比如性别的分布情况如何,平均年龄情况如何。当然这里是需要区分定类和定量数据分别进行描述,比如性别是定类数据使用百分比频数说明,年龄是定量数据使用平均值或中位数进行描述说明,在‘数据分析思维培训之2’里面有详细说明。

为什么首先需要对数据特征进行描述呢?简单来讲,每份数据都有自己的background,研究是基本数据进行,首先需要告诉下别人我研究的数据是一群什么样的人或者物体。在此基础上才能进行后续的进一步分析。

如果研究群体出问题自然后续结论也会有问题,比如研究00后群体,但数据是基本80后,不同群体对于同一事情很可能有着不同的观点和态度。而且在最后进行说明讨论的时候也是基本样本群体的特征而进行,因此在数据分析时,通常首先需要描述清楚研究群体到底是什么样的。

2、数据质量说明

接着,一般需要对数据的质量进行说明,此步骤可以使用研究方法,比如信度分析、组内相关系数ICC等等进行说明,但有时候数据不适合分析方法要求因而不能使用分析方法进行研究。此时正确的做法是详细描述清楚数据的来源,比如实验数据的背景情况下是什么,基于什么样的实验条件因素进行等,充分证明数据的质量可靠即可。形式不限,文字描述或者使用研究方法等均可。

SPSSAU分析途径
 

3、研究目的剖析

对于数据基本特征和数据质量剖析后,接下来最关键的步骤是结合自己的研究目的进行。一般来说研究目的可分为两大类,一是差异关系研究;二是影响关系研究,以及其它。

比如不同性别群体是否吸烟的差异性,不同性别群体对于奢侈品的购买意愿或购买行为差异性。差异关系是一种常见且通用的研究方法,一般涉及到比如卡方分析、方差分析、T检验等,结合自己的数据类型进行选择使用即可。

而对于影响关系而言,更多出现于学术研究中,通过影响关系研究去论证观点的正确性,影响关系通常可使用比如线性回归、logistic回归、岭回归、Robust回归等。具体不同的研究方法可能对应着不同的数据类型,但都不复杂,关键的地方在于符合研究的目的。

有时候为了研究目的服务,可能还会对数据进行‘中间过程处理’,比如对于数据的信息浓缩,可使用因子分析等;或者对于样本群体的聚类,可首先进行聚类分析,然后聚类出不同类别群体再做后续的分析使用。研究目的通常是在准备数据之前就已经确定,因为先有思路再有数据的准备,最后才是进行分析。

4、数据结果呈现

在进行数据研究时,很可能需要对于数据结果进行呈现,通常是两种方式分别是表格和图。表格是通用的方式,但其比较‘枯燥’。因而很多时候需要结合数据情况进行可视化即图形展示。一般针对定类数据的图形较多,比如饼图、条形图、柱形图,帕累托图,词云图等;而涉及到定量数据,由于其通过平均值进行表达描述,因而更多可能会使用比如折线图,簇状图等,当然如果是纯统计角度上,还可能的比如箱线图,散点图,直方图,PPQQ图等,均可在SPSSAU中快速的找到;分析与数据呈现是连在一起的,有了数据研究结论一定需要用某种形式呈现出来,无非是选择图或表,也或者二者均用;核心在于可以直观快速的呈现出结果。

 
SPSSAU分析途径

数据分析思路事实上还有很多,比如模型的灵活运用,模型的选择使用等,同样的数据和研究目的,很可能使用到不同的研究模型,比如研究影响关系,都是定量数据。很可能会使用到线性回归、路径分析等,此时可结合实际情况,以及自身的理解综合评估即可,并无绝对对应关系。

第二部分 问卷量表思维参考

问卷数据是常见的一种数据来源,而且问卷中很多时候会使用到量表数据,针对此种量表数据,SPSSAU提供一种分析思路参考如下图:

其实从上表可知,第1和第2点均是对于数据特征进行描述。接着第4和第5点属于数据质量研究。第3点是为第6,7,8,9这4点服务。第6点是核心研究数据的特征描述。第7和第8点相关和假设分析属于影响关系的分析范畴。最后第9点是差异关系的范畴。

没有绝对的研究步骤,但从上图可以看到,基本上是先数据特征描述,接着数据质量分析,再接着核心研究数据的特征描述,进一步影响关系研究,最后差异关系研究。至于细节性问题,比如信度和效度分析谁先谁后,一般而言是信度在前效度在后。影响关系和差异关系谁先谁后呢?看研究目的,越重要的越放前,相对不重要的靠后即可。

第三部分 问卷非量表思维参考

针对非量表类问卷,非量表类问卷最大的特点是:非常多的单选题,多选题等,通常此类问卷用于政策现状研究、基本态度情况研究等。如果此类问卷,多数是使用频数分析,以及涉及多选题的几类方法;同时还有交叉卡方分析。

 

思路上第1和第2点属于数据特征描述,先搞清楚研究数据的基本背景特征情况。接着对于核心研究项进行特征描述,即第3和第4点。除此之外还可以进行差异关系研究,即第5点,一般使用卡方分析。第6点影响关系研究一般会使用到logistic回归分析等。分析思路上紧密相联,先数据特征描述,核心变量特征描述,差异关系,影响关系研究,并且在最后进行汇总。

第四部分 其它

在数据分析思路上,还会有很多种类型,本文并没有提供到权重研究,事实上很多研究目的在于计算权重体系,当然此种情况目的非常清晰,主要奔着研究目的去就好,正常情况下都会使用到SPSSAU综合评价里面的研究方法。

SPSSAU分析途径

除了权重体系的构建,还有聚类数据,把数据样本群体分成几个类别等分析思路,先把思路确认好,接着大致就可以对应上正确的数据分析方法,准备好数据直接分析就可以。

更多涉及到数据思路上的资料可在SPSSAU手册里面找到参考,包括影响关系类研究,现状政策类研究,调节/中介类研究,实验类差异研究和聚类样本类研究共五类思路等。

更多干货内容可登录SPSSAU官网查看。

SPSSAU数据分析思维培养系列3:分析思路篇的更多相关文章

  1. SPSSAU数据分析思维培养系列3:分析思路

    本文章为SPSSAU数据分析思维培养的第3期文章. 上文讲解如何选择正确的分析方法,除了有正确的分析方法外,还需要把分析方法进行灵活运用.拿到一份数据,应该如何进行分析,总共有几个步骤,第一步第二步应 ...

  2. SPSSAU数据分析思维培养系列2:分析方法

    大家好!在上篇文章中,我们一起学习了如何掌握正确的数据处理思维(文章链接:https://www.cnblogs.com/spssau/p/12523530.html).在完成数据准备和清理工作后,就 ...

  3. SPSSAU数据分析思维培养系列1:数据思维篇

    今天,SPSSAU给大家带来[数据分析思维培养]系列课程.主要针对第一次接触数据分析,完全不懂分析的小白用户,或者懂一些简单方法但苦于没有分析思路,不知道如何规范化分析. 本文章为SPSSAU数据分析 ...

  4. SPSSAU数据分析思维培养系列4:数据可视化篇

    本文章为SPSSAU数据分析思维培养的第4期文章. 前3期内容分别讲述数据思维,分析方法和分析思路.本文讲述如何快速使用SPSSAU进行高质量作图,以及如何选择使用正确的图形. 本文分别从五个角度进行 ...

  5. SPSSAU数据分析思维培养系列2:方法选择篇

    大家好!在上篇文章中,我们一起学习了如何[掌握正确的数据处理思维].在完成数据准备和清理工作后,就要进入到正式分析阶段,而选择什么样的数据分析方法进行分析是关键. 想要进行科学和系统化的数据分析,分析 ...

  6. 实用教程!SPSSAU验证性因子分析思路总结

    验证性因子分析,是用于测量因子与测量项(量表题项)之间的对应关系是否与研究者预测保持一致的一种研究方法.尽管因子分析适合任何学科使用,但以社会科学居多. 目前有很多软件都可以非常便利地实现验证性因子分 ...

  7. enode框架step by step之框架要实现的目标的分析思路剖析1

    enode框架step by step之框架要实现的目标的分析思路剖析1 enode框架系列step by step文章系列索引: 分享一个基于DDD以及事件驱动架构(EDA)的应用开发框架enode ...

  8. 有效的结构化思维训练,MECE分析法

    MECE原则,表达精准分类与全面性的有效利器 结构化思维的本质就是逻辑,其目的在于对问题的思考更完整.更有条理,它帮助我们一个一个找到线头,理清思路,探求事物之间的相互联系.MECE分析法是一种结构化 ...

  9. 小白数据分析——Python职位全链路分析

    最近在做Python职位分析的项目,做这件事的背景是因为接触Python这么久,还没有对Python职位有一个全貌的了解.所以想通过本次分析了解Python相关的职位有哪些.在不同城市的需求量有何差异 ...

随机推荐

  1. PHP curl_multi_remove_handle函数

    (PHP 5) curl_multi_remove_handle — 移除curl批处理句柄资源中的某个句柄资源 说明 int curl_multi_remove_handle ( resource ...

  2. PHP date_sunset() 函数

    ------------恢复内容开始------------ 实例 返回葡萄牙里斯本今天的日落时间: <?php// Lisbon, Portugal:// Latitude: 38.4 Nor ...

  3. PDOStatement::rowCount

    PDOStatement::rowCount — 返回受上一个 SQL 语句影响的行数(PHP 5 >= 5.1.0, PECL pdo >= 0.1.0)高佣联盟 www.cgewang ...

  4. bzoj 1515 [POI2006]Lis-The Postman 有向图欧拉回路

    LINK:Lis-The Postman 看完题觉得 虽然容易发现是有向图欧拉回路 但是觉得很难解决这个问题. 先分析一下有向图的欧拉回路:充要条件 图中每个点的入度-出度=0且整张图是一个强连通分量 ...

  5. 代码扫描Sonar使用教程

    Sonar是一个用于代码质量管理的开源平台,用于管理源代码的质量,可以从多个维度检测代码质量: 可靠性 安全性 可维护性 覆盖率 重复率 通过插件形式,可以支持包括Java,C#,C/C++,PL/S ...

  6. OpenVINO学习系列1

    OpenVINO介绍 OpenVINO是英特尔推出一套基于深度学习的计算机视觉加速优化框架,支持其它机器学习平台模型的压缩优化.加速计算等功能. 自发布以后就得到开发者的青睐,其强大的模型优化与压缩能 ...

  7. SpringMvc异常处理和SpringMvc拦截器

    1. 异常处理思路 Controller调用service,service调用dao,异常都是向上抛出的,最终有DispatcherServlet找异常处理器进 行异常的处理. SpringMVC的异 ...

  8. 几行python代码实现钉钉自动打卡,网友:终于告别缺勤了

    前言 众所周知因为疫情的原因大家都没有办法上学和上班,“钉钉”这个app起到了重大的作用.学校为了学生成绩开启“钉钉”之路.老师也成一个“合格”的主播,感谢XXX童鞋的礼物.666扣起来 老师为了营造 ...

  9. Java高级篇 JVM

    JVM是什么? JVM起了什么作用? JVM包含了什么? JVM中, 一个类 程序是怎么加载的? JVM中垃圾回收机制?

  10. git使用-标签管理

    1.查看所有的标签 git tag 2.创建标签 git tag  name 3.指定提交标签的信息 git tag -a name -m "comment" 4.删除标签 git ...