SPSS常用基础操作(1)——变量分组
有时我们需要对数据资料按照某个规则进行归组,如
在上述资料中,想按照年龄进行分组,30岁以下为组1,30-40岁为组2,40岁以上为组3
有两种方法可以实现:
1.使用计算变量功能
<1>打开转换-计算变量菜单,定义组变量名group,并在数字表达式中赋值为1,点击确定,这样资料中新增了一个名为group的变量,并且值全部为1
<2>打开转换-计算变量菜单,在数字表达式中赋值为2,点击左下方“如果”按钮,设置条件年龄>=30 & 年龄<=40,点击确定,之后看到group变量值中有些被重新赋值为2,这就是根据条件判断的结果
<3>打开转换-计算变量菜单,在数字表达式中赋值为3,点击左下方“如果”按钮,设置条件年龄>40,点击确定。
通过以上操作,我们便根据年龄进行了分组,组别被保存为新变量group中,在后续分析中可以使用它。
我们通过输出窗口中的代码也可以发现,这实际上就是一个if的区间判断过程。
2.使用重新编码功能
使用计算变量功能要重复三次操作,比较繁琐,使用重新编码功能,则一步就可以了打开转换-重新编码为不同变量-将需要判断条件的变量选入右侧列表框-在输出变量框中命名新的变量名-点击下方旧值和新值-设置左侧的旧值和右侧的新值,并添加进右侧列表框中,注意新值有三种指定状态,此外,还需要考虑数据不在设置范围内的情况,例如缺失值等,因此需要最后对所有其他值做出指定,本例中指定处理方式为复制旧值
通常来讲都是对连续变量进行分组,通过赋予每个连续变量一个组别(也可以用组别值直接替换原变量),使其转换为离散变量,实际上也就是将连续变量离散化了。
SPSS常用基础操作(1)——变量分组的更多相关文章
- SPSS常用基础操作(3)——对数据资料进行整理
在实际工作中,往往需要对取得的数据资料进行整理,使其满足特定的分析需求,下面介绍SPSS在资料整理方面的一些功能. 1.加权个案加权个案是指给不同的个案赋予不同的权重,以改变该个案在分析中的重要性.为 ...
- SPSS常用基础操作(2)——连续变量离散化
首先说一下什么是离散化以及连续变量离散化的必要性. 离散化是把无限空间中无限的个体映射到有限的空间中去,通俗点讲就是把连续型数据切分为若干“段”,也称bin,离散化在数据分析中特别是数据挖掘中被普遍采 ...
- python基础操作以及变量运用
今天学习关于pycharm的操作以及变量的知识 1.关于pycharm的基本操作,作为一个小白,仪式感还是要有 在基础界面上新建然后打印hello world,也是对python的一种尊重吧 2.关于 ...
- Mysql常用基础操作(备忘录)
常常忘记mysql的一些命令行操作,甚至于说,比较复杂的sql格式记不住或忘记了,也可能根本不会考虑去记,因此,做一下汇总,当下次出现恍惚时不至于去百度挨个找,有时就是记不起来,但是只要给点药引子,立 ...
- mysql常用基础操作语法(七)--统计函数和分组查询【命令行模式】
注:文中所有的...代表多个. 1.使用count统计条数:select count(字段名...) from tablename; 2.使用avg计算字段的平均值:select avg(字段名) f ...
- Pytorch系列之常用基础操作
各种张量初始化 创建特殊类型的tensor a = torch.FloatTensor(2,3) a = torch.DoubleTensor(2,3) ... 设置pytorch中tensor的默认 ...
- Pytorch系列:(一)常用基础操作
各种张量初始化 创建特殊类型的tensor a = torch.FloatTensor(2,3) a = torch.DoubleTensor(2,3) ... 设置pytorch中tensor的默认 ...
- CentOS7 常用基础操作
系统目录结构了解 CentOS系统中没有磁盘的概念,一切皆文件,/目录下的的一个个文件夹目录就相当于磁盘了,这里简单记录几个常用的目录以及对应的作用: dev:Linux一切皆文件,包括硬件也进行了文 ...
- mysql常用基础操作语法(十二)~~常用数值函数【命令行模式】
数值函数是常用函数之一,也是学习mysql必会的,常用的有如下一些: 1.ceil:返回大于某个数的最小整数值: 2.floor:和上一个相反,返回小于某个数的最大整数值: 3.round:返回某个数 ...
随机推荐
- Tuple,Array,Map,文件操作
Tuple是一个元组: 1,)一组元组中支持多个元素: 2,)一组元组中可以包含不同类型的元素: 3,)返回下标从_1开始. Array 数组 var items=Array(1,2,3,4) Map ...
- 线性时间的排序算法--桶排序(以leetcode164. Maximum Gap为例讲解)
前言 在比较排序的算法中,快速排序的性能最佳,时间复杂度是O(N*logN).因此,在使用比较排序时,时间复杂度的下限就是O(N*logN).而桶排序的时间复杂度是O(N+C),因为它的实现并不是基于 ...
- c++ socket编程步骤
sockets(套接字)编程有三种,流式套接字(SOCK_STREAM),数据报套接字(SOCK_DGRAM),原始套接字(SOCK_RAW):基于TCP的socket编程是采用的流式套接字. 服务器 ...
- Eclipse in Ubuntu16.04LTS Final Beta
#2016.03.30 在虚拟机Ubuntu16.04LTS上,用Eclipse编写运行Java,就目前而言,实在不是明智之举.卡顿极其厉害,还是在物理机上运行吧.那么继续Ubuntu的探索历程. 用 ...
- JSP知识体系大全
Jsp动态网页 Web页面之间有3种关系: 包含 请求转发 重定向 l Jsp的运行原理:(3个) Jsp页面不能直接运行 1.容器调用jsp引擎编译jsp文件 成一个java文本(Servle ...
- jQuery的deferred对象详解(转载)
本文转载自: jQuery的deferred对象详解(转载)
- JVM参数设置、分析(转发)
JVM参数的含义 实例见实例分析 参数名称 含义 默认值 -Xms 初始堆大小 物理内存的1/64(<1GB) 默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时,J ...
- html5,input,表单
<form action="3.html">email:<input type="email" name="email" ...
- Mac 使用笔记
说来惭愧,入手Mac已经快大半年了,但使用上一直是菜鸟. 下面是最近学习和用到的技巧,纪录如下,以后会不定期更新. 开启多个Terminal,这个简直是调程序必备. Command+N 打开新的Ter ...
- install cygwin
make clean