主要在jupyter notebook里面熟悉这个库的使用,它的安装方法与实现,可自行搜索。

Pandas是一个优秀的数据分析工具,官网:http://pandas.pydata.org/

相关的库使用pip安装,用豆瓣的代理下载速度比官方的快,安装命令:

pip install -i https://pypi.douban.com/simple/ matplotlib

pip install -i https://pypi.douban.com/simple/ pandas

pip install -i https://pypi.douban.com/simple/ requests

pip install -i https://pypi.douban.com/simple/ scipy

方法后面是执行的结果,从结果上就能看出方法的作用的,所以没做太多描述。

  1. import os
  2. import pandas as pd
  3. import requests
  1. PATH = 'F:/Git/ML_Python/02iris/'
  2. r = requests.get('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data')
  3. with open(PATH + 'iris.data','w') as f:
  4. f.write(r.text)
  1. os.chdir(PATH)
  1. df = pd.read_csv(PATH + 'iris.data',names=['花萼长度','花萼宽度','花瓣长度','花瓣宽度','类别'])
  2. df.head()

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

  1. .dataframe tbody tr th {
  2. vertical-align: top;
  3. }
  4. .dataframe thead th {
  5. text-align: right;
  6. }
花萼长度 花萼宽度 花瓣长度 花瓣宽度 类别
0 5.1 3.5 1.4 0.2 Iris-setosa
1 4.9 3.0 1.4 0.2 Iris-setosa
2 4.7 3.2 1.3 0.2 Iris-setosa
3 4.6 3.1 1.5 0.2 Iris-setosa
4 5.0 3.6 1.4 0.2 Iris-setosa
  1. df.iloc[:3, :2]

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

  1. .dataframe tbody tr th {
  2. vertical-align: top;
  3. }
  4. .dataframe thead th {
  5. text-align: right;
  6. }
花萼长度 花萼宽度
0 5.1 3.5
1 4.9 3.0
2 4.7 3.2
  1. df.loc[:1,[x for x in df.columns if ('宽度' in x)|('长度' in x)]]

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

  1. .dataframe tbody tr th {
  2. vertical-align: top;
  3. }
  4. .dataframe thead th {
  5. text-align: right;
  6. }
花萼长度 花萼宽度 花瓣长度 花瓣宽度
0 5.1 3.5 1.4 0.2
1 4.9 3.0 1.4 0.2
  1. df['类别'].unique()
  1. array(['Iris-setosa', 'Iris-versicolor', 'Iris-virginica'], dtype=object)
  1. df.count()
  1. 花萼长度 150
  2. 花萼宽度 150
  3. 花瓣长度 150
  4. 花瓣宽度 150
  5. 类别 150
  6. dtype: int64
  1. df[df['类别']=='Iris-virginica'].count()
  1. 花萼长度 50
  2. 花萼宽度 50
  3. 花瓣长度 50
  4. 花瓣宽度 50
  5. 类别 50
  6. dtype: int64
  1. df[(df['类别']=='Iris-virginica')& (df['花瓣长度']>6)].reset_index(drop=True)

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

  1. .dataframe tbody tr th {
  2. vertical-align: top;
  3. }
  4. .dataframe thead th {
  5. text-align: right;
  6. }
花萼长度 花萼宽度 花瓣长度 花瓣宽度 类别
0 7.6 3.0 6.6 2.1 Iris-virginica
1 7.3 2.9 6.3 1.8 Iris-virginica
2 7.2 3.6 6.1 2.5 Iris-virginica
3 7.7 3.8 6.7 2.2 Iris-virginica
4 7.7 2.6 6.9 2.3 Iris-virginica
5 7.7 2.8 6.7 2.0 Iris-virginica
6 7.4 2.8 6.1 1.9 Iris-virginica
7 7.9 3.8 6.4 2.0 Iris-virginica
8 7.7 3.0 6.1 2.3 Iris-virginica
  1. df.describe()

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

  1. .dataframe tbody tr th {
  2. vertical-align: top;
  3. }
  4. .dataframe thead th {
  5. text-align: right;
  6. }
花萼长度 花萼宽度 花瓣长度 花瓣宽度
count 150.000000 150.000000 150.000000 150.000000
mean 5.843333 3.054000 3.758667 1.198667
std 0.828066 0.433594 1.764420 0.763161
min 4.300000 2.000000 1.000000 0.100000
25% 5.100000 2.800000 1.600000 0.300000
50% 5.800000 3.000000 4.350000 1.300000
75% 6.400000 3.300000 5.100000 1.800000
max 7.900000 4.400000 6.900000 2.500000
  1. df.corr()
  2. df.corr(method='kendall')

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

  1. .dataframe tbody tr th {
  2. vertical-align: top;
  3. }
  4. .dataframe thead th {
  5. text-align: right;
  6. }
花萼长度 花萼宽度 花瓣长度 花瓣宽度
花萼长度 1.000000 -0.072112 0.717624 0.654960
花萼宽度 -0.072112 1.000000 -0.182391 -0.146988
花瓣长度 0.717624 -0.182391 1.000000 0.803014
花瓣宽度 0.654960 -0.146988 0.803014 1.000000
  1. df.corr('spearman')

.dataframe tbody tr th:only-of-type {
vertical-align: middle;
}

  1. .dataframe tbody tr th {
  2. vertical-align: top;
  3. }
  4. .dataframe thead th {
  5. text-align: right;
  6. }
花萼长度 花萼宽度 花瓣长度 花瓣宽度
花萼长度 1.000000 -0.159457 0.881386 0.834421
花萼宽度 -0.159457 1.000000 -0.303421 -0.277511
花瓣长度 0.881386 -0.303421 1.000000 0.936003
花瓣宽度 0.834421 -0.277511 0.936003 1.000000

Python Pandas 库的使用例子的更多相关文章

  1. python pandas库——pivot使用心得

    python pandas库——pivot使用心得 2017年12月14日 17:07:06 阅读数:364 最近在做基于python的数据分析工作,引用第三方数据分析库——pandas(versio ...

  2. Python Pandas库的学习(三)

    今天我们来继续讲解Python中的Pandas库的基本用法 那么我们如何使用pandas对数据进行排序操作呢? food.sort_values("Sodium_(mg)",inp ...

  3. Python——Pandas库入门

    一.Pandas库介绍 Pandas是Python第三方库,提供高性能易用数据类型和分析工具 import pandas as pd Pandas基于NumPy实现,常与NumPy和Matplotli ...

  4. Python pandas库159个常用方法使用说明

    Pandas库专为数据分析而设计,它是使Python成为强大而高效的数据分析环境的重要因素. 一.Pandas数据结构 1.import pandas as pd import numpy as np ...

  5. Python Pandas库 初步使用

    用pandas+numpy读取UCI iris数据集中鸢尾花的萼片.花瓣长度数据,进行数据清理,去重,排序,并求出和.累积和.均值.标准差.方差.最大值.最小值

  6. Python Pandas库的学习(一)

    今天我们来学习一下Pandas库,前面我们讲了Numpy库的学习 接下来我们学习一下比较重要的库Pandas库,这个库比Numpy库还重要 Pandas库是在Numpy库上进行了封装,相当于高级Num ...

  7. Python Pandas库的学习(二)

    今天我们继续讲下Python中一款数据分析很好的库.Pandas的学习 接着上回讲到的,如果有人听不懂,麻烦去翻阅一下我前面讲到的Pandas学习(一) 如果我们在数据中,想去3,4,5这几行数据,那 ...

  8. python pandas库的基本内容

    pandas主要为数据预处理 DataFrame import pandas food_info = pandas.read_csv("路径")  #绝对路径和相对路径都可以 ty ...

  9. Python之使用Pandas库实现MySQL数据库的读写

      本次分享将介绍如何在Python中使用Pandas库实现MySQL数据库的读写.首先我们需要了解点ORM方面的知识. ORM技术   对象关系映射技术,即ORM(Object-Relational ...

随机推荐

  1. yii2.0中Rbac 怎么添加超加管理员

    最笨的是定义常量.具体怎么做?看下面: //定义在控制器声明上面define('BEST_PHPER',serialize(array('admin','admin1')));//设置admin管理员 ...

  2. 网页设计——2. html入门

    开始正式的课程讲解了,首先来看看课程体系: Java EE(java 企业应用程序版本) java2 有三个版本:J2 SE(标准版),J2 EE(企业版).J2 ME(微缩版). 我们要掌握J2EE ...

  3. EntityFrameworkCore v1.1.1 问题汇总

    随着宇宙第一IDE的最新版本发布[2017/3/7],AspNetCore 和EntityFrameworkCore(团队)都发布了最新的代码. 不过在我看来,这些到还不是最重要的.最重要的是dotn ...

  4. AngularJS 控制器通信

    指令与控制器之间通信,无非是以下几种方法: 基于scope继承的方式 基于event传播的方式 service的方式 基于scope继承的方式 最简单的让控制器之间进行通信的方法是通过scope的继承 ...

  5. 17. ZooKeeper常见的分布式系统任务——屏障

    以后几节中主要介绍以下内容: 如何执行领导者选举,组员管理和两阶段提交协议等常见的分布式系统任务 如何实现一些分布式数据结构,如屏障(barrier),锁(lock)和队列(queue) 这一章中概述 ...

  6. webrtc视频数据接收端处理流程详解

  7. JavaWeb学习总结(二)——Tomcat服务器学习和使用(一)(转)

    转载自 http://www.cnblogs.com/xdp-gacl/p/3734395.html 一.Tomcat服务器端口的配置 Tomcat的所有配置都放在conf文件夹之中,里面的serve ...

  8. Java后台实现方法

    Java后台实现方法 首先后台结构分为四个部分(以表schedule为例) entity>mapper>service>controller 1. 在entity里面写好实体,新建目 ...

  9. 机器学习——深度学习(Deep Learning)

    Deep Learning是机器学习中一个非常接近AI的领域,其动机在于建立.模拟人脑进行分析学习的神经网络,近期研究了机器学习中一些深度学习的相关知识,本文给出一些非常实用的资料和心得. Key W ...

  10. Python爬虫(二十四)_selenium案例:执行javascript脚本

    本章叫介绍如何使用selenium在浏览器中使用js脚本,更多内容请参考:Python学习指南 隐藏百度图片 #-*- coding:utf-8 -*- #本篇将模拟执行javascript语句 fr ...