Python Pandas 库的使用例子

主要在jupyter notebook里面熟悉这个库的使用，它的安装方法与实现，可自行搜索。

Pandas是一个优秀的数据分析工具，官网：http://pandas.pydata.org/

相关的库使用pip安装，用豆瓣的代理下载速度比官方的快，安装命令：

pip install -i https://pypi.douban.com/simple/ matplotlib

pip install -i https://pypi.douban.com/simple/ pandas

pip install -i https://pypi.douban.com/simple/ requests

pip install -i https://pypi.douban.com/simple/ scipy

方法后面是执行的结果，从结果上就能看出方法的作用的，所以没做太多描述。

import os
import pandas as pd
import requests

PATH = 'F:/Git/ML_Python/02iris/'
r = requests.get('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data')
with open(PATH + 'iris.data','w') as f:
    f.write(r.text)

os.chdir(PATH)

df = pd.read_csv(PATH + 'iris.data',names=['花萼长度','花萼宽度','花瓣长度','花瓣宽度','类别'])
df.head()

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

.dataframe tbody tr th {
    vertical-align: top;
}
.dataframe thead th {
    text-align: right;
}

	花萼长度	花萼宽度	花瓣长度	花瓣宽度	类别
0	5.1	3.5	1.4	0.2	Iris-setosa
1	4.9	3.0	1.4	0.2	Iris-setosa
2	4.7	3.2	1.3	0.2	Iris-setosa
3	4.6	3.1	1.5	0.2	Iris-setosa
4	5.0	3.6	1.4	0.2	Iris-setosa

df.iloc[:3, :2]

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

.dataframe tbody tr th {
    vertical-align: top;
}
.dataframe thead th {
    text-align: right;
}

	花萼长度	花萼宽度
0	5.1	3.5
1	4.9	3.0
2	4.7	3.2

df.loc[:1,[x for x in df.columns if ('宽度' in x)|('长度' in x)]]

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

.dataframe tbody tr th {
    vertical-align: top;
}
.dataframe thead th {
    text-align: right;
}

	花萼长度	花萼宽度	花瓣长度	花瓣宽度
0	5.1	3.5	1.4	0.2
1	4.9	3.0	1.4	0.2

df['类别'].unique()

array(['Iris-setosa', 'Iris-versicolor', 'Iris-virginica'], dtype=object)

df.count()

花萼长度    150
花萼宽度    150
花瓣长度    150
花瓣宽度    150
类别      150
dtype: int64

df[df['类别']=='Iris-virginica'].count()

花萼长度    50
花萼宽度    50
花瓣长度    50
花瓣宽度    50
类别      50
dtype: int64

df[(df['类别']=='Iris-virginica')& (df['花瓣长度']>6)].reset_index(drop=True)

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

.dataframe tbody tr th {
    vertical-align: top;
}
.dataframe thead th {
    text-align: right;
}

	花萼长度	花萼宽度	花瓣长度	花瓣宽度	类别
0	7.6	3.0	6.6	2.1	Iris-virginica
1	7.3	2.9	6.3	1.8	Iris-virginica
2	7.2	3.6	6.1	2.5	Iris-virginica
3	7.7	3.8	6.7	2.2	Iris-virginica
4	7.7	2.6	6.9	2.3	Iris-virginica
5	7.7	2.8	6.7	2.0	Iris-virginica
6	7.4	2.8	6.1	1.9	Iris-virginica
7	7.9	3.8	6.4	2.0	Iris-virginica
8	7.7	3.0	6.1	2.3	Iris-virginica

df.describe()

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

.dataframe tbody tr th {
    vertical-align: top;
}
.dataframe thead th {
    text-align: right;
}

	花萼长度	花萼宽度	花瓣长度	花瓣宽度
count	150.000000	150.000000	150.000000	150.000000
mean	5.843333	3.054000	3.758667	1.198667
std	0.828066	0.433594	1.764420	0.763161
min	4.300000	2.000000	1.000000	0.100000
25%	5.100000	2.800000	1.600000	0.300000
50%	5.800000	3.000000	4.350000	1.300000
75%	6.400000	3.300000	5.100000	1.800000
max	7.900000	4.400000	6.900000	2.500000

df.corr()
df.corr(method='kendall')

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

.dataframe tbody tr th {
    vertical-align: top;
}
.dataframe thead th {
    text-align: right;
}

	花萼长度	花萼宽度	花瓣长度	花瓣宽度
花萼长度	1.000000	-0.072112	0.717624	0.654960
花萼宽度	-0.072112	1.000000	-0.182391	-0.146988
花瓣长度	0.717624	-0.182391	1.000000	0.803014
花瓣宽度	0.654960	-0.146988	0.803014	1.000000

df.corr('spearman')

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

.dataframe tbody tr th {
    vertical-align: top;
}
.dataframe thead th {
    text-align: right;
}

	花萼长度	花萼宽度	花瓣长度	花瓣宽度
花萼长度	1.000000	-0.159457	0.881386	0.834421
花萼宽度	-0.159457	1.000000	-0.303421	-0.277511
花瓣长度	0.881386	-0.303421	1.000000	0.936003
花瓣宽度	0.834421	-0.277511	0.936003	1.000000

Python Pandas 库的使用例子的更多相关文章

python pandas库——pivot使用心得
python pandas库——pivot使用心得 2017年12月14日 17:07:06 阅读数:364 最近在做基于python的数据分析工作,引用第三方数据分析库——pandas(versio ...
Python Pandas库的学习（三）
今天我们来继续讲解Python中的Pandas库的基本用法那么我们如何使用pandas对数据进行排序操作呢? food.sort_values("Sodium_(mg)",inp ...
Python——Pandas库入门
一.Pandas库介绍 Pandas是Python第三方库,提供高性能易用数据类型和分析工具 import pandas as pd Pandas基于NumPy实现,常与NumPy和Matplotli ...
Python pandas库159个常用方法使用说明
Pandas库专为数据分析而设计,它是使Python成为强大而高效的数据分析环境的重要因素. 一.Pandas数据结构 1.import pandas as pd import numpy as np ...
Python Pandas库初步使用
用pandas+numpy读取UCI iris数据集中鸢尾花的萼片.花瓣长度数据,进行数据清理,去重,排序,并求出和.累积和.均值.标准差.方差.最大值.最小值
Python Pandas库的学习（一）
今天我们来学习一下Pandas库,前面我们讲了Numpy库的学习接下来我们学习一下比较重要的库Pandas库,这个库比Numpy库还重要 Pandas库是在Numpy库上进行了封装,相当于高级Num ...
Python Pandas库的学习（二）
今天我们继续讲下Python中一款数据分析很好的库.Pandas的学习接着上回讲到的,如果有人听不懂,麻烦去翻阅一下我前面讲到的Pandas学习(一) 如果我们在数据中,想去3,4,5这几行数据,那 ...
python pandas库的基本内容
pandas主要为数据预处理 DataFrame import pandas food_info = pandas.read_csv("路径") #绝对路径和相对路径都可以 ty ...
Python之使用Pandas库实现MySQL数据库的读写
本次分享将介绍如何在Python中使用Pandas库实现MySQL数据库的读写.首先我们需要了解点ORM方面的知识. ORM技术对象关系映射技术,即ORM(Object-Relational ...

随机推荐

【转】Nginx反向代理和负载均衡
原文链接:http://www.cnblogs.com/shuoer/p/7820899.html Nginx反向代理和负载均衡环境说明由于我使用的是windows系统,所以我用虚拟机虚拟出来了3 ...
Swift Runtime ？
你肯定也想过在OC中相信每一个iOS开发都知道Runtime, 现在Swift也更新到4.0版本了,要是你也学习过Swift的话你可能也会想过这样一个问题,OC大家都是到是有动态性的,你能通过run ...
PHP能引起安全的函数
php中需要禁用以下函数来提高安全性打开php.ini 找到 disable_functions .然后禁用以下函数 disable_functions = pcntl_alarm, pcntl_ ...
appium+Linux环境安装配置
背景:想要在Jenkins上跑appium的自动化测试,所以想要在Jenkins服务器(Linux远程)上安装appium服务,故而研究了一下appium+Linux下安装.虽然有无数的前辈踩过坑 ...
移动端H5制作安卓和IOS的坑持续更新...
移动端H5制作安卓和IOS的坑持续更新... 前言:最近参加公司的H5页面创意竞赛,又遇到不少页面在不同系统上的坑.踩坑之余,觉得很多之前遇到的知识点都忘了,索性开一篇博文,把这些坑都统一归纳起来, ...
用 Label 控制 Service 的位置 - 每天5分钟玩转 Docker 容器技术（106）
上一节我们讨论了 Service 部署的两种模式:global mode 和 replicated mode.无论采用 global mode 还是 replicated mode,副本运行在哪些节点 ...
Cesium中Clock控件及时间序列瓦片动态加载
前言前面已经写了两篇博客介绍Cesium,一篇整体上简单介绍了Cesium如何上手,还有一篇介绍了如何将Cesium与分布式地理信息处理框架Geotrellis相结合.Cesium的强大之处也在于其 ...
【POJ2823】Sliding Window
http://poj.org/problem?id=2823 题意:你有一个长度n的序列,分别询问[1,k],[2,k+1],[3,k+2],...,[n-k+1,n]这n-k+1个区间的最大值和最小 ...
《算法》C/C++ 图形处理
概述一般图形输出无法就是用循环输出 ,提前构造好图形. 两种方式 ** 模拟法直接输出** ** 二维数组构造输出** 问题描述利用字母可以组成一些美丽的图形,下面给出了一个例子: ABCDEF ...
Flask-admin 笔记一（快速启用）
1,快速启用 1) 安装flask-admin pip install flask-admin 2) 配置使用 from flask import Flask from flask_admin i ...

Python Pandas 库的使用例子

Python Pandas 库的使用例子的更多相关文章

随机推荐

热门专题