白话空间统计之四:P值和Z值(上):零如果
本来今天想要讲讲软件操作的,后来发现好像还有好几个重要的指标没有说,干脆等所有说完在讲操作吧。否则操作出来的结果会发现大量的“不明觉厉”。
首先是空间统计里面非常神奇的两个值:P值和Z值。
要说这两个值之前。还是要复习一下统计学的概念。毕竟空间统计的理论基础还是建立在经典统计学上面的。
首先,统计学里面。有一个叫做“零如果”的概念很厉害,一定要说说。
零如果(null hypothesis),有时候又称原如果,官方的解释是:指进行统计检验时预先建立的如果。也就是说,你在检验你的结果之前。先对这些结果如果一个数值区间,这个区间通常是符合某种概率分布的情况。如果你的真实结果偏离了你设定的区间。就表示发生了小概率事件。这样你原来的如果就不成立了。
例如以下图所看到的:
如果你的计算结果落在-2到2之间,就表示你的如果是能够接受得。可是不在这个范围内,就说明消息小概率事件了。既然有小概率事件,就说明两种可能:1,你的如果有错误。2,出现了异常值。
这个奇妙的零如果有啥用呢?看以下这个样例:
我们来抛一枚硬币,(我发现统计学,特别是经典统计学最喜欢抛硬币了)。在丢之前,我们就已经设定了不管正反两面的概率都在50%左右。(实际上更接近48%——52%这个区间)那么假设我们丢出来的结果,出现了正面概率高达80%,而反面才出现了20%。那就是说。超出了我预设的范围,发生了小概率现象,那么这样的小概率现象就非常值得研究了,虾神个人觉得,假设出现了这样的情况,最大可能是这个硬币被做了手脚。
当然,还有可能是出现硬币竖立了起来这样的极小概率的事情……这样的就得归类到异常值里面去了。
(关于抛硬币的第二种思维方式,还能够看这篇文章:抛硬币的两种思维方式:
在经典统计里面,零如果觉得你统计计算的数据是符合某种概率的,那么在空间统计里面。零如果表示什么呢?
看以下这个样例:
假设说,A市在7月份发生了200起案件,理论上,不设定条件的话,这200起案件应该是平均的分布在A市的每一个区域的,可是实际上这是不可能的,我们会发现某些地区,案发率远远高于其它地区。
那么上面那个命题,最開始我们说明的,200起案件。平均分布在全市各个地方。就是所谓的“零如果”,在空间统计中,零如果指的就是空间位置在一定区域里面呈现全然随机(均匀)分布(在自然现象里面,均匀分布是极小概率才会出现的,基本上都能够忽略了。所以一般谈的就是全然随机)。
依照这种如果,我们就能够对整个城市的案件案发地点进行统计分析了,如果计算出来的结果,符合我们如果,那么就仅仅能说,这200起案件。发生的地点是随机的,没有聚集规律或者离散的规律。
在空间数据的分析中。有一个非常重要内容,就是知道数据分布是否有规律。
拿到一份数据的时候。第一时间,要了解的,就是这份数据是不是有规律。由于有规律的数据才干进行更好的分析。而假设你拿到的这份数据是一份随机分布的数据,那么一般来说,就没有啥分析研究的可能了。由于纯随机(全然随机)是无法预測也无法找到模式的,就像素数(素数在数轴上出现的位置就是全然随机的,无法找到不论什么规律和模式)。
所谓的纯随机。也有三种可能。一种是你的如果是纯随机的。二是你要计算的数据本身是纯随机的。第三就是你要计算的数据与其周边数据的关系是纯随机。
那么怎样对随机如果进行推断呢?也就是说。你的结果是接受零如果还是拒绝零如果。这样的就能够通过P、Z两种值的结果来帮助我们进行推断。
(未完待续)
白话空间统计之四:P值和Z值(上):零如果的更多相关文章
- 白话空间统计之:Moran's I(莫兰指数)
前两天聊了空间统计学里面的两个经典概念,今天来说说第一篇文章留下的大坑:Moran's I. 首先,Moran's I这个东西.官方叫做:莫兰指数,是澳大利亚统计学家帕特里克·阿尔弗雷德·皮尔斯·莫兰 ...
- ArcGIS高程Z值的去除方法
在ArcGIS中,我们常用的几何类型有点.线.面.体(体,在涉及三维的情况下使用),但在这之外,可能会遇到带ZM的类型,如图所示,面ZM,它与面类似,但比面多两个字段. 在编辑中查看草图属性可看到Z值 ...
- 已知空间两点组成的直线求线上某点的Z值
已知空间两点组成的直线求线上某点的Z值,为什么会有这种看起来比较奇怪的求值需求呢?因为真正三维空间的几何计算是比较麻烦的,很多时候需要投影到二维,再反推到三维空间上去. 复习下空间直线方程:已知空间上 ...
- 已知空间三点组成的面求该面上某点的Z值
已知空间三点,那么可以就可以确定空间三点组成的平面.此时可以根据某一点的X值和Y值,来求取该点在平面上的Z值.这个过程对于求三角面片上某点的高程或者权值特别有用,其本身也可以看作一种线性插值. 其算法 ...
- Moran’s I空间统计中出现内存溢出的问题
在经济学.资源管理.生物地理学.政治地理学和人口统计等领域,经常会有如下的研究需求: 研究区域中的富裕区和贫困区之间的最清晰边界在哪里? 研究区域中存在可以找到异常消费模式的位置吗? 研究区域中意想不 ...
- Z-score(Z值)的意义--转载
http://blog.sina.com.cn/s/blog_72208a6a0101cdt1.html http://www.docin.com/p-350677620.html http://we ...
- 几何不能具有Z值
ArcEngine 复制要素Geometry时,产生 几何不能具有Z值 的异常 解决方法:http://forums.esri.com/Thread.asp?c=159&f=1707& ...
- 判断IFeatureClass图形是否含有Z值信息,若有为IPoint赋Z值
判断IFeatureClass图形是否含有Z值信息 IFeatureClass featureClass = this.pLayer.FeatureClass; string shapeFieldNa ...
- 统计某一字段等于不同值的个数的sql语句(分享)
本文介绍下,用一条sql语句统计某一字段等于不同值的个数,方法很独特,有需要的朋友参考下. 表t,数据: id type001 1001 0002 1001 ...
随机推荐
- mysql创建新用户
如果你需要添加 MySQL 用户,你只需要在 mysql 数据库中的 user 表添加新用户即可. 以下为添加用户的的实例,用户名为qi,密码为python,并授权用户可进行SELECT,INSERT ...
- OpenCV2:第一章 图像表示
一.简介 在OpenCV中,可以用C++语法的Mat类来表示一张图像 也可以用C语法的lpllmage或CvMat结构体来表示一张图像 1.单通道像素值 2.多通道像素值 OpenCV默认颜色顺序为B ...
- luogu P3393 逃离僵尸岛-搜索剪枝+spfa
P3393 逃离僵尸岛 题目描述 小a住的国家被僵尸侵略了!小a打算逃离到该国唯一的国际空港逃出这个国家. 该国有N个城市,城市之间有道路相连.一共有M条双向道路.保证没有自环和重边. K个城市已经被 ...
- java中的编译时与运行时
----?基础知识 -- 编译时 编译器将源代码翻译成机器能够读懂的代码,如java中就是翻译成jvm能够读懂的字节码文件.简单说,编译时就是机器帮我们检查代码是否有出现语法错误,关键字写错之类的 ...
- ubuntu18.04 server配置静态ip
最新发布的ubuntu18.04 server,启用了新的网络工具netplan,对于命令行配置网络参数跟之前的版本有比较大的差别,现在介绍如下:1.其网络配置文件是放在/etc/netplan/50 ...
- Linux磁盘管理及Lvm
1. 硬盘接口 IDE: SATA:常用: SCSI:主要用于高端服务器,linux默认: SAS 2. 硬盘种类 SATA硬盘:串口硬盘,有较强的纠错能力: SCSI 硬盘:默认硬盘: SAS 硬盘 ...
- 笔记本无法从DHCP服务器获取地址怎么解决?
首先,开始/运行,输入 cmd,再输入ipconfig,看看你的IP地址是不是正常的,假如不是,就是获取不到IP地址.如果得到的IP是:169.254.x.x 表示客户机无法得到DHCP的响应.(如果 ...
- cobbler 无人值守-介绍
cobbler 介绍 快速网络安装linux操作系统的服务,支持众多的Linux版本,也支持网络安装windows系统 PXE的二次封装,将多种安装参数封装到一个菜单 它是由Python编写的 还可以 ...
- tornado框架基础06-SQLAlchemy连接数据库
01 ORM 在服务器后台,数据是要存储在数据库的,但是如果项目在开发和部署的时候,是使用的不同的数据库,该怎么办呢?是不是需要把所有的 SQL 语句都再重新写一遍呢? 和数据库相关,不同的数据库需要 ...
- 【HIHOCODER 1105】题外话·堆
描述 小Ho有一个糖果盒子,每过一段时间小Ho都会将新买来的糖果放进去,同时他也会不断的从其中挑选出最大的糖果出来吃掉,但是寻找最大的糖果不是一件非常简单的事情,所以小Ho希望能够用计算机来他帮忙计算 ...