Python实现描述性统计

该篇笔记由木东居士提供学习小组、资料

描述性统计的概念很好理解，在日常工作中我们也经常会遇到需要使用描述性统计来表述的问题。以下，我们将使用Python实现一系列的描述性统计内容。

有关python环境的安装就次略过。

本次数据集由数据科学家联盟提供，https://pan.baidu.com/s/1lXAnyvSoti-U44MU2fubgw。

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

%matplotlib inline

data = pd.read_excel(r'C:\Users\user\Desktop\描述性.xlsx',encoding='UTF-8')

data = data.iloc[:20]

集中趋势

# 计算平均值

# 法一

print("算术平均数：%.2f" %data.mean())
算术平均数：4.40

# 计算平均值

# 法二：几何平均数

data['data'] = data['data'].astype(int)

s = 1

for i in data['data']:

    s = i * s

print("几何平均数:%.2f" %np.sqrt(s))

几何平均数:351941.81

# 众数

# 法一：

print("众数为：%d," %data.mode().iloc[0])

众数为：4,

#众数

# 法二

from scipy.stats import mode

mode_num = mode(data)

print("众数为：%d, 众数的个数为：%d,"%(mode_num[0][0], mode_num[1][0]))

众数为：4, 众数的个数为：4,

# 中位数

# 法一：

print("中位数:%d" %data.median())

中位数:4

# 中位数

# 法二

print("中位数:%d" %np.percentile(data,50))

中位数:4

# 中位数

# 法三

print("中位数:%d" %data.quantile(.50))

中位数:4

离散趋势
# 方差

# 法一：

print("方差：%d" %data.var())

方差：6

# 方差

# 法二：

s = 0

for i in data['data']:

    s = (i - data.mean())**2 + s

print("方差：%d" %(s/(len(data)-1)))

方差：6

# 标准差

# 法一

print("标准差:%d" %data.std())

标准差:2

# 标准差

# 法二：

print("标准差:%d" %np.sqrt(s/(len(data)-1)))

标准差:2

# 极差

data.max() - data.min()

data    9

dtype: int32

# 平均绝对离差

M = 0

for i in data['data']:

    M += abs(i - data.mean())

print(M/len(data))

data    2.04

dtype: float64

# 上四分位数

# 法一

np.percentile(data,75)

6.0

# 上四分位数

# 法二

data.quantile(.75)

data    6.0

Name: 0.75, dtype: float64

# 下四分位数

# 法一

data.quantile(.25)

data    2.0

Name: 0.25, dtype: float64

# 下四分位数

# 法二：

np.percentile(data,25)

2.0

# 四分位差

np.percentile(data,75) - np.percentile(data,25)

4.0

# 离散系数

data.std()/data.mean()

data    0.582476

dtype: float64

分布的形状
# 偏度

from scipy import stats

stats.skew(data['data']) 

0.4264951788847028

# 峰度

stats.kurtosis(data['data'])

-0.5821005917159772

# 概括性信息

data.describe()

    data

count    20.000000

mean    4.400000

std    2.562893

min    1.000000

25%    2.000000

50%    4.000000

75%    6.000000

max    10.000000

参考链接：https://blog.csdn.net/qq_43315928/article/details/102151709

Python实现描述性统计的更多相关文章

使用Python进行描述性统计
目录 1 描述性统计是什么?2 使用NumPy和SciPy进行数值分析 2.1 基本概念 2.2 中心位置(均值.中位数.众数) 2.3 发散程度(极差,方差.标准差.变异系数) 2.4 偏差程度(z ...
Pandas描述性统计
有很多方法用来集体计算DataFrame的描述性统计信息和其他相关操作. 其中大多数是sum(),mean()等聚合函数,但其中一些,如sumsum(),产生一个相同大小的对象. 一般来说,这些方法采 ...
Pandas | 06 描述性统计
有很多方法用来集体计算DataFrame的描述性统计信息和其他相关操作. 其中大多数是sum(),mean()等聚合函数. 一般来说,这些方法采用轴参数,就像ndarray.{sum,std,...} ...
Pandas 之描述性统计案例
认识 jupyter地址: https://nbviewer.jupyter.org/github/chenjieyouge/jupyter_share/blob/master/share/panda ...
SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类
https://www.zhihu.com/topic/19582125/top-answershttps://wenku.baidu.com/search?word=spss&ie=utf- ...
$\S1$ 描述性统计
在认识客观世界的过程中,统计学的思想和方法经常起着不可替代的作用.在许多工程及自然科学的专业领域中,包括可靠性分析.质量控制.生物信息.脑科学.心理分析.经济分析.金融风险管理.社会科学推断.行为科学 ...
Python获得百度统计API的数据并发送邮件
Python获得百度统计API的数据并发送邮件小工具本来这么晚是不准备写博客的,当是想到了那个狗子绝对会在开学的时候跟我逼逼这个事情,所以,还是老老实实地写一下吧. Baidu统计API的使 ...
python编写文件统计脚本
python编写文件统计脚本思路:用os模块中的一些函数(os.listdir().os.path.isdir().os.path.join().os.path.abspath()等) 实现功能:显 ...
Python实现代码统计工具——终极加速篇
Python实现代码统计工具--终极加速篇声明本文对于先前系列文章中实现的C/Python代码统计工具(CPLineCounter),通过C扩展接口重写核心算法加以优化,并与网上常见的统计工具做对 ...

随机推荐

layui 自定义模块
新建模块目录modules 新建common.js layui.define(['jquery'], function (exports) { var $ = layui.jquery; var ob ...
Linux下使用matlab在后台默默的运行.m文件（无界面形式）
Linux下使用matlab在后台默默的运行.m文件(无界面形式)本主在Ubuntu18.04LTS上已经安装了matlab直接运行Matlab$ matlab会启动 matlab,出现启动界面但想要 ...
深层目录文件复制，C# 递归，录音录像图片文件过多，用于测试程序
/// <summary> /// 录音录像图片文件过多只复制目录的前几个文件,用于测试程序 /// d:\file/images/2019-10/01/01/xxxxx.jpg(前几个文 ...
C++中STL中简单的Vector的实现
该vector只能容纳标准库中string类, 直接上代码了,StrVec.h文件内容为: #ifndef STRVEC_H #define STRVEC_H #include<iostream ...
Python 入门(1)：hello world 到流程控制
1.hello world 在D:\python\目录下新建文件hello.txt,编写代码如下 print("hello world!") 修改后缀名为.py,执行hello.p ...
datanode启动异常（Incompatible clusterIDs）
问题: 正常start-all.sh无法启动datanode进程,但是./hadoop-daemon.sh start datanode又可以启动.过一会后datanode进程又莫名消失. 原理: 多 ...
玩机之Honor_V10
作为一个热爱手机的Geek,自然是经历了很多的刷机和改装手机的经验,当然翻车的经验也是有的.一般来说的折腾手机都是在遇到某一版本使用以及各方面都比较稳定的时候才会选择让手机停留在哪一版本.下面我就来分 ...
js 不同浏览器的类型判断 navigator.userAgent
一.通过navigator.userAgent来进行浏览器类型判断 // 判断浏览器内核.手机系统等,使用 browser.userAgent.mobile var browser = { userA ...
Maven聚合项目的创建
1.项目结构如下步骤如下: 点击Finish 这里父项目需要加入如下的构建依赖: <dependencyManagement> <dependencies> <depe ...
@SuppressWarnings注解用法
@SuppressWarnings注解主要用在取消一些编译器产生的警告对代码左侧行列的遮挡,有时候这会挡住我们断点调试时打的断点. 如图所示: 这时候我们在方法上加上@SuppressWarnings ...

Python实现描述性统计

Python实现描述性统计的更多相关文章

随机推荐

热门专题