认识数据-数据的计量尺度(Levels of Measurement)
一、 数据的计量尺度(Levels of Measurement)
一般认为,数据是对客观现象计量的结果。按照对事物计量的精确程度,可将所采用的计量尺度由低级到高级分为四个层次:
1、定类尺度(Nominal Level /列名尺度):按照事物的某种属性对其进行平行的分类或分组。例:人口的性别(男、女);企业的所有制性质(国有、集体、私营等)
- n 计量层次最低
- n 对事物进行平行的分类
- n 各类别可以指定数字代码表示
- n 具有=或¹的数学特性
- n 数据表现为“类别”
- l 定类尺度只测度了事物之间的类别差,而对各类之间的其他差别却无法从中得知,因此各类地位相同,顺序可以任意改变。
- l 对定类尺度的计量结果,可以且只能计算每一类别中各元素个体出现的频数 (frequency)。
- l 对事物进行分类时,必须符合穷尽(exhaustive)和互斥(mutually exclusive)要求。
2、定序尺度(Ordinal Level\顺序尺度):是对事物之间等级或顺序差别的一种测度。例:产品等级(一等品、二等品…);考试成绩(优、良、中、可、差)
- n 对事物分类的同时给出各类别的顺序
- n 比定类尺度精确
- n 不仅可以测度类别差(分类),还可以测度次序差(比较优劣或排序)
- n 数据表现为“类别”,但有序
- l 无法测出类别之间的准确差值
- l 该尺度的计量结果只能排序,不能进行算术运算。
- l 具有>或<的数学特性
3、定距尺度(Interval Level/间隔尺度):是对事物类别或次序之间间距的测度。例:100分制考试成绩;摄氏温度对不同地区温度的测量
- n 不仅能将事物区分为不同类型并进行排序,而且可准确指出类别之间的差距是多少
- n 比定序尺度精确
- n 定距尺度通常以自然或物理单位为计量尺度,因此数据表现为“数值”
- n 没有绝对零点;“0”是测量尺度上的一个测量点,并不代表“没有”
- n 计量结果可以进行加减运算,具有 + 或 - 的数学特性
4、定比尺度(Ratio Level/比率尺度):是能够测算两个测度值之间比值的一种计量尺度。例:职工月收入;企业产值;公制的距离、重量
- n 与定距尺度属于同一层次,计量结果也表现为数值;
- n 除了具有其他三种计量尺度的全部特点外,还具有可计算两个测度值之间比值的特点;
- n “0”表示“没有”,即它有一固定的绝对“零点”,因此它可进行加、减、乘、除运算(而定距尺度只可进行加减运算)
高层次的计量尺度具有低层次计量尺度的全部特性,但反之不行
可将高层次计量尺度的计量结果转换为低层次计量尺度的计量结果,但不能反过来
二、数据分布的特征描述手段:集中趋势(位置)、离中趋势(分散程度)
1、对于集中趋势的测度:
- 定类数据:众数
- 定序数据:中位数和四分位数
- 定距和定比数据:平均数(均值)
- 众数、中位数和均值的比较
定义:集中趋势 (Central tendency)
- 一组数据向其中心值靠拢的倾向和程度
- 测度集中趋势就是寻找数据一般水平的代表值或中心值
- 不同类型的数据用不同的集中趋势测度值
- 低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据
- 选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定
2、离中趋势
- 离中趋势的各测度值是对数据离散程度所作的描述
- 反映各变量值远离其中心值的程度,因此也称为离中趋势
- 从另一个侧面说明了集中趋势测度值的代表程度
- 不同类型的数据有不同的离散程度测度值
3、定类数据的整理与显示
基本过程:
- 列出各类别
- 计算各类别的频数
- 制作频数分布表
- 用图形显示数据
主要指标:
- 频数:落在各类别中的数据个数
- 比例:某一类别数据占全部数据的比值
- 比率:不同类别数值的比值
- 百分比:将对比的基数作为100而计算的比值
认识数据-数据的计量尺度(Levels of Measurement)的更多相关文章
- Kettle实现数据抽取、转换、装入和加载数据-数据转移ETL工具
原文地址:http://www.xue51.com/soft/5341.html Kettle是来自国外的一款开源的ETL工具,纯java编写,可以在Window.Linux.Unix上运行,绿色无需 ...
- vue2.* 目录结构分析 数据绑定 循环渲染数据 数据渲染02
一.目录 结构分析 node_modules:项目依赖文件(也可以说是模块) src:开发时所用的资源 assets:静态资源文件 App.vue:根组件(最基础的公共页面) main.js:实例化v ...
- 用python+sklearn(机器学习)实现天气预报数据 数据
用python+sklearn机器学习实现天气预报 数据 项目地址 系列教程 勘误表 0.前言 1.爬虫 a.确认要被爬取的网页网址 b.爬虫部分 c.网页内容匹配取出部分 d.写入csv文件格式化 ...
- WCF 数据数据 DataTable
一般在WCf数据大数据是 List集合 或者 Json. public DataTable GetProperitybyModelCode(string modelCode) { using (var ...
- 大数据 > 数据平台方案评估
分类 当前措施 说明 百度竞价如何进行数据分析(SEM工程师)数据来源: 1. 百度后台推广数据:api 总展现 总点击 点击率 总消费 点击均价 BDP功能点 1. 串联百度->网站商务通-& ...
- 如何导出和导入mysql数据(数据迁移)
. 导出数据库数据 mysqldump -uroot -p dp_db > dumpout.sql 其中 root是账户名 dp_db是需要导出的数据库名称 dumpout.sql存储导出的数据 ...
- 怎样在C#中从数据库中读取数据(数据读取器)
实现在C#中通过语句,查询数据库中的数据 SqlConnection con = null; //创建SqlConnection 的对象 try //try里面放可能出现错误的代码 ...
- 你还记的那一年你我学习的-->>用表组织数据*(数据表)
不知不觉,踏上IT之路,光阴似箭,日月如梭.虽好像回到从前,回到那个无忧无虑的童年,回到那个花样少年的青春;回到那个年少幼稚的小学;回到那个整天幻想的初中;回到那个顽强不屈,誓死不弃的高中;回到那个整 ...
- 我终于理解了LISP『代码即数据|数据即代码』的含义
以前我一直不能理解LISP里引用的作用,感觉引用和字符串没什么区别.比如:> (define (func) 'ok) > (func) 'ok 这里把引用ok当做了函数func的返 ...
随机推荐
- ss-libev控制脚本
适用于:shadowsocks-libev-3.0.3 操作系统:CentOS6.8 #!/bin/sh SHADOWSOCKS_SERVER="/usr/local/shadowsocks ...
- PHP 设计模式系列 —— 工厂方法模式(Factory Method)(转)
1.模式定义 定义一个创建对象的接口,但是让子类去实例化具体类.工厂方法模式让类的实例化延迟到子类中. 2.问题引出 框架需要为多个应用提供标准化的架构模型,同时也要允许独立应用定义自己的域对象并对其 ...
- VMware安装CentOS以及CentOS的一些配置
转:http://blog.csdn.net/u013082989/article/details/51911330
- tcp面试题
常见面试题[问题1]为什么连接的时候是三次握手,关闭的时候却是四次握手? 答:因为当Server端收到Client端的SYN连接请求报文后,可以直接发送SYN+ACK报文.其中ACK报文是用来应答的, ...
- L2-008 最长对称子串 (25 分)
对给定的字符串,本题要求你输出最长对称子串的长度.例如,给定Is PAT&TAP symmetric?,最长对称子串为s PAT&TAP s,于是你应该输出11. 输入格式: 输入在一 ...
- qduoj LC的课后辅导
描述 有一天,LC给我们出了一道题,如图: 这个图形从左到右由若干个 宽为1 高不确定 的小矩形构成,求出这个图形所包含的最大矩形面积. 输入 多组测试数据每组测试数据的第一行为n(0 <= n ...
- 在学习linux基础入门时的一些问题总结(1)
本周在实验楼完成了<linux基础入门>的21个实验,虽然之前已经学习过linux的相关课程,对linux下的命令也有一些了解和实践,但完成这21个实验以及35个练习题仍然遇到了许多的问题 ...
- 06 面向对象:多态&抽象类&接口&权限修饰符&内部类
多态: /* 多态(polymorphic)概述 * 事物存在的多种形态 多态前提 * a:要有继承关系. * b:要有方法重写. * c:要有父类引用指向子类对象. * 成员变量 * 编译看左边(父 ...
- 《DSP using MATLAB》Problem 5.31
第3小题: 代码: %% ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ %% Out ...
- 踩坑tomcat8.5的cookie机制
https://www.pomelolee.com/1601.html tomcat升级到8.5版本 发现登录和退出报错,报错日志为下 [http-nio-8080-exec-20] 2016 Aug ...