pandas的数据统计函数

# 1汇总类统计

# 2唯一去重和按值计数

# 3 相关系数和协方差

import pandas as pd 

#  0 读取csv数据

df = pd.read_csv("beijing_tianqi_2018.csv")

df.head()

# 换掉温度后面的后缀

df.loc[:,"bWendu"] = df["bWendu"].str.replace("℃","").astype("int32")

df.loc[:,"yWendu"] = df["yWendu"].str.replace("℃","").astype("int32")

df.head(3)

# 1 汇总类统计

# 一下子提取所有数字列的统计结果

df.describe()

# 查看单个Series的数据

df["bWendu"].mean()

# 最高温

df["bWendu"].max()

# 最低温

df["bWendu"].min()

# 2 唯一去重和按值计数

# 2.1 唯一性去重  一般不用于数值列，而是枚举、分类列

df["fengxiang"].unique()

df["tianqi"].unique()

df["fengli"].unique()

# 2.2 按值计数（降序排列）

df["fengxiang"].value_counts()

df["tianqi"].value_counts()

df["fengli"].value_counts()

# 3 相关系数和协方差

# 用途:

    # 1、两只股票，这不是同涨同落？程度多大？正相关还是负相关？

    #2、产品销量的波动，跟哪些因素正相关、负相关，程度有多大？

# 1、协方差:衡量同向反向程度。  如果协方差为正，说明想想X,Y同向程度越高；

# 如果协方差为负，说明X,Y反向运动，协方差越小说明反向程度越高

# 2、相关系数：衡量相似度程度。当他们的相关系数为1时，说明两个变量变化时

# 的正向相似度最大，当相关系数为-1时，说明两个变量变化的反向相似度最大

# 协方差矩阵

df.cov()

# 相关系数矩阵

df.corr()

# 单独查看空气质量和最高温度的相关系数

df["aqi"].corr(df["bWendu"])

df["aqi"].corr(df["yWendu"])

# 空气质量和温差的相关系数

df["aqi"].corr(df["bWendu"]-df["yWendu"])

pandas的数据统计函数的更多相关文章

Pandas数据统计函数
Pandas数据统计函数汇总类统计唯一去重和按值计数相关系数和协方差 0.读取csv数据 1.汇总类统计 2.唯一去重和按值计数 2.1 唯一性去重一般不用于数值列,而是枚举.分类列 2.2 ...
python-数据描述与分析2（利用Pandas处理数据缺失值的处理数据库的使用）
2.利用Pandas处理数据2.1 汇总计算当我们知道如何加载数据后,接下来就是如何处理数据,虽然之前的赋值计算也是一种计算,但是如果Pandas的作用就停留在此,那我们也许只是看到了它的冰山一角,它 ...
利用Python进行数据分析(12) pandas基础: 数据合并
pandas 提供了三种主要方法可以对数据进行合并: pandas.merge()方法:数据库风格的合并: pandas.concat()方法:轴向连接,即沿着一条轴将多个对象堆叠到一起: 实例方法c ...
【转载】使用Pandas对数据进行筛选和排序
使用Pandas对数据进行筛选和排序本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas对数据进行筛选和排序目录: sort() 对单列数据进行排序对多列数据进行排序获取金额最小前10项 ...
【转载】使用Pandas进行数据提取
使用Pandas进行数据提取本文转载自:蓝鲸的网站分析笔记原文链接:使用python进行数据提取目录 set_index() ix 按行提取信息按列提取信息按行与列提取信息提取特定日期的信 ...
【转载】使用Pandas进行数据匹配
使用Pandas进行数据匹配本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas进行数据匹配目录 merge()介绍 inner模式匹配 lefg模式匹配 right模式匹配 outer模式 ...
【转载】使用Pandas创建数据透视表
使用Pandas创建数据透视表本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas创建数据透视表目录 pandas.pivot_table() 创建简单的数据透视表增加一个行维度(inde ...
Pandas 把数据写入csv
Pandas 把数据写入csv from sklearn import datasets import pandas as pd iris = datasets.load_iris() iris_X ...
pandas学习(数据分组与分组运算、离散化处理、数据合并)
pandas学习(数据分组与分组运算.离散化处理.数据合并) 目录数据分组与分组运算离散化处理数据合并数据分组与分组运算 GroupBy技术:实现数据的分组,和分组运算,作用类似于数据透视表 ...

随机推荐

php语法标识符
php语法标识符一.总结一句话总结: 常用<?php //这里写代码 ?>:其它要么不常用,要么需要开配置二.PHP四大标识符(语法环境) 参考或转自:PHP四大标识符(语法环境) ...
libusb获取usb设备的idVendor(vid)，idProduct(pid)，以及Serial Number
发表于2015/6/23 21:55:11 4594人阅读最近在做关于usb设备的项目,用到了libusb,发现关于这个的函数库的介绍,讲解很少,下面仅仅是简单展示一些基本的使用方法,以备后用. ...
Mac ssh key生成
转载https://blog.csdn.net/wangjunling888/article/details/51115659 1. 查看秘钥是否存在打开终端查看是否已经存在SSH密钥:cd ~/. ...
tensorflow学习——调试ctc的两个bug
InvalidArgumentError (see above for traceback): Not enough time for target transition sequence (requ ...
开发一个Flink应用
步骤列表本次实战经历以下步骤: 创建应用:编码:构建:提交任务到Flink,验证功能: 环境信息Flink:1.7:Flink所在机器的操作系统:CentOS Linux release 7.5.18 ...
CentOS6.5 编译安装Nginx
一.准备编译环境 1. 系统为centos6.5最小安装,关闭selinux,关闭防火墙. 2. 安装编译工具 # yum -y install gcc gcc-c++ autoconf automa ...
SpringMVC +Spring + MyBatis + Mysql + Redis(作为二级缓存) 配置
转载:http://blog.csdn.net/xiadi934/article/details/50786293 项目环境: 在SpringMVC +Spring + MyBatis + MySQL ...
ionic3构建过程中遇到的找不到AndroidManifest.xml的问题
问题如下: Failed to install 'ionic-plugin-keyboard': Error: ENOENT: no such file or directory, open '/Us ...
【Qt开发】Qt标准对话框之QMessageBox
好久没有更新博客,主要是公司里面还在验收一些东西,所以没有及时更新.而且也在写一个基于Qt的画图程序,基本上类似于PS的东西,主要用到的是Qt Graphics View Framework.好了,现 ...
（转载）gcc编译选项总结
转载自:https://blog.csdn.net/gatieme/article/details/21389603 常用编译选项 gcc and g++分别是gnu的c & c++编译器 g ...

pandas的数据统计函数

pandas的数据统计函数的更多相关文章

随机推荐

热门专题