白话空间统计之四:P值和Z值(上):零如果
本来今天想要讲讲软件操作的,后来发现好像还有好几个重要的指标没有说,干脆等所有说完在讲操作吧。否则操作出来的结果会发现大量的“不明觉厉”。
首先是空间统计里面非常神奇的两个值:P值和Z值。
要说这两个值之前。还是要复习一下统计学的概念。毕竟空间统计的理论基础还是建立在经典统计学上面的。
首先,统计学里面。有一个叫做“零如果”的概念很厉害,一定要说说。
零如果(null hypothesis),有时候又称原如果,官方的解释是:指进行统计检验时预先建立的如果。也就是说,你在检验你的结果之前。先对这些结果如果一个数值区间,这个区间通常是符合某种概率分布的情况。如果你的真实结果偏离了你设定的区间。就表示发生了小概率事件。这样你原来的如果就不成立了。
例如以下图所看到的:
如果你的计算结果落在-2到2之间,就表示你的如果是能够接受得。可是不在这个范围内,就说明消息小概率事件了。既然有小概率事件,就说明两种可能:1,你的如果有错误。2,出现了异常值。
这个奇妙的零如果有啥用呢?看以下这个样例:
我们来抛一枚硬币,(我发现统计学,特别是经典统计学最喜欢抛硬币了)。在丢之前,我们就已经设定了不管正反两面的概率都在50%左右。(实际上更接近48%——52%这个区间)那么假设我们丢出来的结果,出现了正面概率高达80%,而反面才出现了20%。那就是说。超出了我预设的范围,发生了小概率现象,那么这样的小概率现象就非常值得研究了,虾神个人觉得,假设出现了这样的情况,最大可能是这个硬币被做了手脚。
当然,还有可能是出现硬币竖立了起来这样的极小概率的事情……这样的就得归类到异常值里面去了。
(关于抛硬币的第二种思维方式,还能够看这篇文章:抛硬币的两种思维方式:
在经典统计里面,零如果觉得你统计计算的数据是符合某种概率的,那么在空间统计里面。零如果表示什么呢?
看以下这个样例:
假设说,A市在7月份发生了200起案件,理论上,不设定条件的话,这200起案件应该是平均的分布在A市的每一个区域的,可是实际上这是不可能的,我们会发现某些地区,案发率远远高于其它地区。
那么上面那个命题,最開始我们说明的,200起案件。平均分布在全市各个地方。就是所谓的“零如果”,在空间统计中,零如果指的就是空间位置在一定区域里面呈现全然随机(均匀)分布(在自然现象里面,均匀分布是极小概率才会出现的,基本上都能够忽略了。所以一般谈的就是全然随机)。
依照这种如果,我们就能够对整个城市的案件案发地点进行统计分析了,如果计算出来的结果,符合我们如果,那么就仅仅能说,这200起案件。发生的地点是随机的,没有聚集规律或者离散的规律。
在空间数据的分析中。有一个非常重要内容,就是知道数据分布是否有规律。
拿到一份数据的时候。第一时间,要了解的,就是这份数据是不是有规律。由于有规律的数据才干进行更好的分析。而假设你拿到的这份数据是一份随机分布的数据,那么一般来说,就没有啥分析研究的可能了。由于纯随机(全然随机)是无法预測也无法找到模式的,就像素数(素数在数轴上出现的位置就是全然随机的,无法找到不论什么规律和模式)。
所谓的纯随机。也有三种可能。一种是你的如果是纯随机的。二是你要计算的数据本身是纯随机的。第三就是你要计算的数据与其周边数据的关系是纯随机。
那么怎样对随机如果进行推断呢?也就是说。你的结果是接受零如果还是拒绝零如果。这样的就能够通过P、Z两种值的结果来帮助我们进行推断。
(未完待续)
白话空间统计之四:P值和Z值(上):零如果的更多相关文章
- 白话空间统计之:Moran's I(莫兰指数)
前两天聊了空间统计学里面的两个经典概念,今天来说说第一篇文章留下的大坑:Moran's I. 首先,Moran's I这个东西.官方叫做:莫兰指数,是澳大利亚统计学家帕特里克·阿尔弗雷德·皮尔斯·莫兰 ...
- ArcGIS高程Z值的去除方法
在ArcGIS中,我们常用的几何类型有点.线.面.体(体,在涉及三维的情况下使用),但在这之外,可能会遇到带ZM的类型,如图所示,面ZM,它与面类似,但比面多两个字段. 在编辑中查看草图属性可看到Z值 ...
- 已知空间两点组成的直线求线上某点的Z值
已知空间两点组成的直线求线上某点的Z值,为什么会有这种看起来比较奇怪的求值需求呢?因为真正三维空间的几何计算是比较麻烦的,很多时候需要投影到二维,再反推到三维空间上去. 复习下空间直线方程:已知空间上 ...
- 已知空间三点组成的面求该面上某点的Z值
已知空间三点,那么可以就可以确定空间三点组成的平面.此时可以根据某一点的X值和Y值,来求取该点在平面上的Z值.这个过程对于求三角面片上某点的高程或者权值特别有用,其本身也可以看作一种线性插值. 其算法 ...
- Moran’s I空间统计中出现内存溢出的问题
在经济学.资源管理.生物地理学.政治地理学和人口统计等领域,经常会有如下的研究需求: 研究区域中的富裕区和贫困区之间的最清晰边界在哪里? 研究区域中存在可以找到异常消费模式的位置吗? 研究区域中意想不 ...
- Z-score(Z值)的意义--转载
http://blog.sina.com.cn/s/blog_72208a6a0101cdt1.html http://www.docin.com/p-350677620.html http://we ...
- 几何不能具有Z值
ArcEngine 复制要素Geometry时,产生 几何不能具有Z值 的异常 解决方法:http://forums.esri.com/Thread.asp?c=159&f=1707& ...
- 判断IFeatureClass图形是否含有Z值信息,若有为IPoint赋Z值
判断IFeatureClass图形是否含有Z值信息 IFeatureClass featureClass = this.pLayer.FeatureClass; string shapeFieldNa ...
- 统计某一字段等于不同值的个数的sql语句(分享)
本文介绍下,用一条sql语句统计某一字段等于不同值的个数,方法很独特,有需要的朋友参考下. 表t,数据: id type001 1001 0002 1001 ...
随机推荐
- typescript知识教程
https://ts.xcatliu.com/basics/type-of-function.html
- table、tr、td表格的行、单元格等属性说明
table.tr.td表格的行.单元格等属性说明 <table>标签定义HTML表格.简单的HTML表格由table元素以及一个或多个tr.th或td元素组成. tr元素定义表格行,th元 ...
- css--css选择器,伪类
前戏 前面我们说过CSS规则由选择器和声明组成,我们要给标签设置属性,那我们就要找到对应的标签,CSS选择器可以帮我们找到我们需要的标签 css选择器有: 标签选择器 类选择器 ID选择器 全局选择器 ...
- fio测试nvme性能
#cat /sys/block/nvme0n1/queue/scheduler none #cat /sys/block/sda/queue/scheduler noop deadline [cfq] ...
- 使用 Pytorch 实现 skip-gram 的 word2vec
转载请注明 AIQ - 最专业的机器学习大数据社区 http://www.6aiq.com AIQ 机器学习大数据 知乎专栏 点击关注 链接地址: https://github.com/lonePa ...
- C字符串指针遇到的问题
看下面的示例代码: int main() { char *ptr = "GeeksQuiz"; printf("%c\n", *&*&*ptr) ...
- C指针计算字符串长度
#include <stdio.h> int stringLength (const char *string) { const char *cptr = string; while ( ...
- OI Journal
佛系更新,哪天想起来就写点. 10.11 班主任硬灌的鸡汤真香 qtmd,简直就是硬扯,说怎么怎么着说不定就能多拿一分两分,一分两分就能割掉好多人 ......螺旋懵圈状,我表示硬憋着不笑 HIAHI ...
- SpringBoot的线程调度
Spring Boot默认提供了一个ThreadPoolTaskExecutor作为线程调度器,只需要在配置类中使用注解EnableAsync即可开启异步线程调度.在实际要执行的Bean中使用@Asy ...
- scp免密码拷贝和ssh免密码登录
版权声明:本文为博主原创文章,未经允许不得转载. 在平常的工作中经常在两个服务器之间传输文件,而且经常从本地远程登录服务器,每次都要输入密码显然很没效率,这时候该怎么办呢? 首先假设服务器A和B,要想 ...