该篇笔记由木东居士提供学习小组、资料

描述性统计的概念很好理解,在日常工作中我们也经常会遇到需要使用描述性统计来表述的问题。以下,我们将使用Python实现一系列的描述性统计内容。

有关python环境的安装就次略过。

本次数据集由数据科学家联盟提供,https://pan.baidu.com/s/1lXAnyvSoti-U44MU2fubgw。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline data = pd.read_excel(r'C:\Users\user\Desktop\描述性.xlsx',encoding='UTF-8')
data = data.iloc[:20]
集中趋势

# 计算平均值
# 法一
print("算术平均数:%.2f" %data.mean())
算术平均数:4.40
# 计算平均值
# 法二:几何平均数 data['data'] = data['data'].astype(int)
s = 1
for i in data['data']:
s = i * s
print("几何平均数:%.2f" %np.sqrt(s)) 几何平均数:351941.81
# 众数
# 法一:
print("众数为:%d," %data.mode().iloc[0]) 众数为:4, #众数
# 法二
from scipy.stats import mode
mode_num = mode(data)
print("众数为:%d, 众数的个数为:%d,"%(mode_num[0][0], mode_num[1][0])) 众数为:4, 众数的个数为:4,
# 中位数
# 法一:
print("中位数:%d" %data.median()) 中位数:4 # 中位数
# 法二
print("中位数:%d" %np.percentile(data,50)) 中位数:4 # 中位数
# 法三
print("中位数:%d" %data.quantile(.50)) 中位数:4
离散趋势
# 方差
# 法一:
print("方差:%d" %data.var()) 方差:6 # 方差
# 法二:
s = 0
for i in data['data']:
s = (i - data.mean())**2 + s print("方差:%d" %(s/(len(data)-1))) 方差:6
# 标准差
# 法一
print("标准差:%d" %data.std()) 标准差:2 # 标准差
# 法二:
print("标准差:%d" %np.sqrt(s/(len(data)-1))) 标准差:2
# 极差
data.max() - data.min() data 9
dtype: int32
# 平均绝对离差
M = 0
for i in data['data']:
M += abs(i - data.mean()) print(M/len(data)) data 2.04
dtype: float64
# 上四分位数
# 法一
np.percentile(data,75) 6.0 # 上四分位数
# 法二
data.quantile(.75) data 6.0
Name: 0.75, dtype: float64
# 下四分位数
# 法一
data.quantile(.25) data 2.0
Name: 0.25, dtype: float64 # 下四分位数
# 法二:
np.percentile(data,25) 2.0
# 四分位差
np.percentile(data,75) - np.percentile(data,25) 4.0
# 离散系数
data.std()/data.mean() data 0.582476
dtype: float64
分布的形状
# 偏度
from scipy import stats
stats.skew(data['data']) 0.4264951788847028
# 峰度
stats.kurtosis(data['data']) -0.5821005917159772
# 概括性信息
data.describe() data
count 20.000000
mean 4.400000
std 2.562893
min 1.000000
25% 2.000000
50% 4.000000
75% 6.000000
max 10.000000

参考链接:https://blog.csdn.net/qq_43315928/article/details/102151709

Python实现描述性统计的更多相关文章

  1. 使用Python进行描述性统计

    目录 1 描述性统计是什么?2 使用NumPy和SciPy进行数值分析 2.1 基本概念 2.2 中心位置(均值.中位数.众数) 2.3 发散程度(极差,方差.标准差.变异系数) 2.4 偏差程度(z ...

  2. Pandas描述性统计

    有很多方法用来集体计算DataFrame的描述性统计信息和其他相关操作. 其中大多数是sum(),mean()等聚合函数,但其中一些,如sumsum(),产生一个相同大小的对象. 一般来说,这些方法采 ...

  3. Pandas | 06 描述性统计

    有很多方法用来集体计算DataFrame的描述性统计信息和其他相关操作. 其中大多数是sum(),mean()等聚合函数. 一般来说,这些方法采用轴参数,就像ndarray.{sum,std,...} ...

  4. Pandas 之 描述性统计案例

    认识 jupyter地址: https://nbviewer.jupyter.org/github/chenjieyouge/jupyter_share/blob/master/share/panda ...

  5. SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类

    https://www.zhihu.com/topic/19582125/top-answershttps://wenku.baidu.com/search?word=spss&ie=utf- ...

  6. \(\S1\) 描述性统计

    在认识客观世界的过程中,统计学的思想和方法经常起着不可替代的作用.在许多工程及自然科学的专业领域中,包括可靠性分析.质量控制.生物信息.脑科学.心理分析.经济分析.金融风险管理.社会科学推断.行为科学 ...

  7. Python获得百度统计API的数据并发送邮件

    Python获得百度统计API的数据并发送邮件 小工具  本来这么晚是不准备写博客的,当是想到了那个狗子绝对会在开学的时候跟我逼逼这个事情,所以,还是老老实实地写一下吧.   Baidu统计API的使 ...

  8. python编写文件统计脚本

    python编写文件统计脚本 思路:用os模块中的一些函数(os.listdir().os.path.isdir().os.path.join().os.path.abspath()等) 实现功能:显 ...

  9. Python实现代码统计工具——终极加速篇

    Python实现代码统计工具--终极加速篇 声明 本文对于先前系列文章中实现的C/Python代码统计工具(CPLineCounter),通过C扩展接口重写核心算法加以优化,并与网上常见的统计工具做对 ...

随机推荐

  1. [转帖]8个最佳Docker容器监控工具,收藏了

    8个最佳Docker容器监控工具,收藏了 https://www.sohu.com/a/341156793_100159565?spm=smpc.author.fd-d.9.1574127778732 ...

  2. JAVA十六进制数据接收与传输

    一.十六进制转换工具类 主要包含十六进制字符串转ASCII,ASCII转十六进制字符串以及十六进制字符串转Byte数组等方法: /** * Created by wly on 2018/4/17. * ...

  3. 守护线程在logback中的使用 - 论基础知识的重要性

    守护线程在logback中的使用 先说问题,在java应用中,logback的异步Appender是怎么在主线程结束后,停下来的? 复盘 我在一个logback的测试用例中,写了这样的代码和logba ...

  4. SpringBoot整合freemarker 引用基础

    原 ElasticSearch学习笔记Ⅲ - SpringBoot整合ES 新建一个SpringBoot项目.添加es的maven坐标如下: <dependency> <groupI ...

  5. redis 中文显示的问题解决方法

    在redis 中存储中文,读取会出现乱码(其实不是乱码,只是不是我们存的中文显示) 1 redis> set test "我们" 2 OK 3 redis> get t ...

  6. springcolud 的学习(一),架构的发展史

    一.传统架构 传统的SSH架构,分为三层架构 web控制层.业务逻辑层.数据库访问层. 传统架构也就是单点应用,就是大家在刚开始初学JavaEE技术的时候SSH架构或者SSM架构,业务没有进行拆分,都 ...

  7. PE系统——安装教程

    本教程使用到的软件我会在本文末给出,若失效了请私信我,重新上传. 1.安装PE系统前,把U盘插在电脑上(如果你需要安装Windows10系统,请插入一个容量至少8G的U盘).当然容量最好是32—64G ...

  8. webpack集成vue单文件模式的很多坑(研究了1个星期)

    1.一开始不知道局部安装webpack后,如何调用webpack. 后来看说明文档(webpack中文网)才知道,有个npx可以启动本地安装的webpack. 我估计:全局安装webpack,全局的w ...

  9. Navicat连接腾讯云服务器上的数据库

    下面介绍Navicat连接腾讯云服务器上的数据库的两种方法: 方法一:[不需要修改相关远程客户端连接权限] 点击安装好的桌面navicat图标,进入后如下图: 连接方法:ssh中输入自己服务器的外网i ...

  10. 微信小程序下拉框组件

    >>下拉组件 1.组件结构: 2.index.js: //index.js Component({ /** * 组件的属性列表 */ properties: { propArray: { ...