-- 1、查看缺失值
CREATE TABLE dnull AS SELECT * FROM data; -- 复制数据
SELECT * FROM dnull WHERE
房屋编码 IS NULL OR
小区 IS NULL OR
朝向 IS NULL OR
房屋单价 IS NULL OR
参考首付 IS NULL OR
参考总价 IS NULL OR
经度 IS NULL OR
纬度 IS NULL; -- 查询缺失值

-- 2、缺失值处理方法1:删除
DELETE FROM dnull WHERE 房屋单价 IS NULL; -- 删除单列缺失值
DELETE FROM dnull WHERE
房屋编码 IS NULL OR
小区 IS NULL OR
朝向 IS NULL OR
房屋单价 IS NULL OR
参考首付 IS NULL OR
参考总价 IS NULL OR
经度 IS NULL OR
纬度 IS NULL; -- 删除多列数据

-- 3、缺失值处理方法2:均值填充
SELECT AVG(房屋单价) FROM dnull; -- 查看均值(如果为空则该列没有有效数据)
UPDATE dnull
SET 房屋单价 = (SELECT AVG(房屋单价) FROM dnull)
WHERE 房屋单价 IS NULL; -- 直接填充均值

-- 4、缺失值处理方法2:众数填充
SELECT 朝向,COUNT(朝向) FROM dnull GROUP BY 朝向 ORDER BY COUNT(朝向) DESC;
SELECT 参考总价,COUNT(参考总价) FROM dnull GROUP BY 参考总价 ORDER BY COUNT(参考总价) DESC; -- 查询众数
-- 这里注意了,一般越离散的数据越适用
UPDATE dnull SET 参考总价 =
(
WITH zs AS (SELECT 参考总价,COUNT(参考总价) FROM dnull GROUP BY 参考总价)
SELECT MAX(参考总价) FROM zs
)
WHERE 参考总价 IS NULL; -- 直接填充众数
-- 这里通过WITH语句来筛选众数的最大值

-- 注意:当数据本身有特殊含义的时候,尽量不填充缺失值,直接删除数据即可,例如一个街镇的人口数等

PostgreSQL-13-缺失值处理的更多相关文章

  1. PostgreSQL 13.4的安装记录

    PostgreSQL 13.4的安装记录 想着MySQL被Oracle给买了,总得做点别的准备不是,找了找别的开源的关系型数据库,貌似PostgreSQL的评价很不错,就试试先 因为是window10 ...

  2. PostgreSQL 13支持增量排序(Incremental Sorting)

    PostgreSQL 13支持增量排序(Incremental Sorting) PostgreSQL 13一个重要的功能是支持增量排序,使用order by 时可以加速排序,SQL如下 select ...

  3. centos使用Yum安装postgresql 13

    rpm源安装 yum install -y https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat ...

  4. WFS: postgresql(postgis)和shp文件查询效率对比

    对GeoServer上的WFS的各种数据源查询效率感兴趣,做个测试.本次测试了Postgresql.geopackage.shp文件三种数据源的查询效率,无论是本机还是服务器环境,pg存储查询效率都比 ...

  5. Docker环境下升级PostgreSQL

    查阅PostgreSQL官方文档可以得知,官方提供了两种方式对数据库进行升级--pg_dumpall与pg_upgrade. pg_dumpall是将数据库转储成一个脚本文件,然后在新版数据库中可以直 ...

  6. iNeuOS工业互联网操作系统部署在华为欧拉(openEuler)国产系统,vmware、openEuler、postgresql、netcore、nginx、ineuos一站式部署

    目       录 1.      概述... 3 2.      创建虚拟机&安装华为欧拉(openEuler)系统... 4 2.1           创建新的虚拟机... 4 2.2  ...

  7. 远程连接PostgreSQL

    在华为云上安装了PostgreSQL,本地使用pgAdmin客户端来访问PostgreSQL 首先,需要在华为云服务器上,放开访问PostgreSQL的5432端口,否则会报请求超时 通过创建安全组来 ...

  8. PostgreSQL逻辑订阅

    测试环境:PostgreSQL 13.2 1.逻辑订阅简介 由于物理复制只能做到这个集群的复制,不能正对某个对象(表)进行复制,且物理复制的备库只能读,不能写.相反,逻辑订阅同时支持主备库读写,且可以 ...

  9. PostgreSQL源码编译

    环境:Ubuntu 16.04+PostgresQL13.2 1.指定安装路径 ./configure --prefix=/opt/postgresql 2.编译安装 sudo make sudo m ...

  10. 基于SPSS的美国老年夏季运动会运动员数据分析

             本文是课程训练的报告,部分图片由于格式原因并没有贴出,有兴趣者阅读完整报告者输入以下链接 http://files.cnblogs.com/files/liugl7/基于SPSS的老 ...

随机推荐

  1. 【LeetCode】Maximum Depth of Binary Tree

    http://oj.leetcode.com/problems/maximum-depth-of-binary-tree/ public class Solution { public int max ...

  2. Machine Learning in Action(1) K-近邻

    机器学习分两大类,有监督学习(supervised learning)和无监督学习(unsupervised learning).有监督学习又可分两类:分类(classification.)和回归(r ...

  3. 安装MySQLdb出现的问题

    枫竹梦的环境是自己编译安装的MySQL,安装目录在/usr/local/mysql. 下载MySQLdb,由于网络上大多数的链接都是指向比较老的sourceforge上,而我们安装最新的1.2.5,h ...

  4. 安装Nginx四层负载均衡

    Nginx1.9开始支持tcp层的转发,通过stream实现的,而socket也是基于tcp通信. stream模块默认不安装的,需要手动添加参数:–with-stream,官方下载地址:downlo ...

  5. U盘安装Ubuntu 14.04 LTS正式版 出现如下的提示,不能继续,如何操作?

    I had a problem (minor annoyance) when booting up Arch linux with a USB drive connected. The problem ...

  6. hdu-2647 Reward && hdu-2049产生冠军 &&hdu-3342Legal or Not(拓扑排序)

    题目链接: hdu-2647 /*Problem : 2647 ( Reward ) Judge Status : Accepted RunId : 16919085 Language : G++ A ...

  7. Linux-Nginx和NFS

    1 虚拟化 查看系统信息 cat /proc/meninfo cat /proc/cpuinfo 其中 flags里面的信息可以查看该cpu是否支持虚拟化 flags上有vmx svm等表示可以虚拟化 ...

  8. 微信小程序自定义下导航页面切换效果的合理写法

    上图::: 导航模板内容页面的定义: <template name="naviBot">   <view class='navwrap t_cen font_26 ...

  9. linux内存占用分析

    概述 想必在linux上写过程序的同学都有分析进程占用多少内存的经历,或者被问到这样的问题——你的程序在运行时占用了多少内存(物理内存)?通常我们可以通过top命令查看进程占用了多少内存.这里我们可以 ...

  10. 一些常用的页面js收集

    //正则表达式 验证整数格式function checkInt(tint){ var re=/^[-]{0,1}[1-9]+[0-9]*]*$/; //判断字符串是否为数字 if (re.test(t ...