pandas中的数据结构-DataFrame

DataFrame是什么？

表格型的数据结构

DataFrame 是一个表格型的数据类型，每列值类型可以不同
DataFrame 既有行索引、也有列索引
DataFrame 常用于表达二维数据，但可以表达多维数据

DataFrame创建

从字典创建

>>> import pandas as pd

>>> frame=pd.DataFrame(data)

>>> data={'name':['a','b','c'],'pay':[4000,5000,7000]}

>>> frame=pd.DataFrame(data)

>>> frame

  name   pay

0    a  4000

1    b  5000

2    c  7000

>>>

从二维ndarray创建

>>> import pandas as pd

>>> import numpy as np

>>> data=np.array([('a',4000),('b',6000),('c',9000)])

>>> frame=pd.DataFrame(data,index=range(1,4),columns=['name','pay'])

>>> frame

  name   pay

1    a  4000

2    b  6000

3    c  9000

DataFrame操作方法

查看数据集的头和尾

head( 1 ) # 查看第一行
tail(3) #

>>> frame

  name   pay

1    a  4000

2    b  6000

3    c  9000

>>> frame.head(1)

  name   pay

1    a  4000

>>> frame.tail(3)

  name   pay

1    a  4000

2    b  6000

3    c  9000

查看索引、列和y numpy 数组

.index
columns
values
describe()

>>> frame.index

RangeIndex(start=1, stop=4, step=1)

>>> frame.columns

Index(['name', 'pay'], dtype='object')

>>> frames.values

>>> frame.values

array([['a', '4000'],

       ['b', '6000'],

       ['c', '9000']], dtype=object)

>>> frame.describe()

       name   pay

count     3     3

unique    3     3

top       b  9000

freq      1     1

修改索引index

>>> frame.index=['x','y','z']

>>> frame

  name   pay

x    a  4000

y    b  6000

z    c  9000

修改列的标题

>>> frame.columns=['name1','pay2']

>>> frame

  name1  pay2

x     a  4000

y     b  6000

z     c  9000

修改特定位置元素

修改某一行

>>> frame.values[0]=['d',2]

>>> frame

  name1  pay2

x     d     2

y     b  6000

z     c  9000

修改某一行的值

>>> frame.values[1][1]=9000

>>> frame

  name1  pay2

x     d     2

y     b  9000

z     c  9000

选择数据

获取某行数据

>>> frame

  name1  pay2

x     d     2

y     b  9000

z     c  9000

>>> frame.loc['x']

name1    d

pay2     2

Name: x, dtype: object

按照列获取数据

>>> frame

  name1  pay2

x     d     2

y     b  9000

z     c  9000

>>> frame['name1']

x    d

y    b

z    c

Name: name1, dtype: object

>>> frame.pay

1    4000

2    6000

3    9000

Name: pay, dtype: object

>>>

切片

>>> frame.iloc[:2,1]

1    4000

2    6000

Name: pay, dtype: object

修改

>>> frame['name']='admin'

>>> frame

    name   pay

1  admin  4000

2  admin  6000

3  admin  9000

删除

>>> frame

    name   pay

1  admin  4000

2  admin  6000

3  admin  9000

>>> del frame['name']

>>> frame

    pay

1  4000

2  6000

3  9000

排序

对下标排序

sort_index () 在指定轴上根据索引进行排序，默认升序

>>> b=pd.DataFrame(np.arange(12).reshape(3,4),index=['a','b','c'])

>>> b

   0  1   2   3

a  0  1   2   3

b  4  5   6   7

c  8  9  10  11

>>> b.sort_index(ascending=False)#行坐标降序

   0  1   2   3

c  8  9  10  11

b  4  5   6   7

a  0  1   2   3

>>> b

   0  1   2   3

a  0  1   2   3

b  4  5   6   7

c  8  9  10  11

>>> b.sort_index(axis=1,ascending=False)#列坐标降序

    3   2  1  0

a   3   2  1  0

b   7   6  5  4

c  11  10  9  8

对于值排序

>>> c=b.sort_values(2,ascending=False)

>>> c

   0  1   2   3

c  8  9  10  11

b  4  5   6   7

a  0  1   2   3

>>> c=b.sort_values('a',axis=1,ascending=False)#按照axis=1

>>> c

    3   2  1  0

a   3   2  1  0

b   7   6  5  4

c  11  10  9  8

表格运算

>>> a=pd.DataFrame(np.arange(12).reshape(3,4))

>>> b=pd.DataFrame(np.arange(12).reshape(3,4))

>>> a

   0  1   2   3

0  0  1   2   3

1  4  5   6   7

2  8  9  10  11

>>> b

   0  1   2   3

0  0  1   2   3

1  4  5   6   7

2  8  9  10  11

>>> a.add(b)

    0   1   2   3

0   0   2   4   6

1   8  10  12  14

2  16  18  20  22

>>> a.sub(b)

   0  1  2  3

0  0  0  0  0

1  0  0  0  0

2  0  0  0  0

>>> a.mul(b)

    0   1    2    3

0   0   1    4    9

1  16  25   36   49

2  64  81  100  121

>>> a.div(b)

     0    1    2    3

0  NaN  1.0  1.0  1.0

1  1.0  1.0  1.0  1.0

2  1.0  1.0  1.0  1.0

比较运算

比较运算只能比较相同索引的元素，不进行补齐
采用 > < >= <= == != 等符号进行的二元运算产生

布尔对象

pandas中的数据结构-DataFrame的更多相关文章

Python之Pandas中Series、DataFrame
Python之Pandas中Series.DataFrame实践 1. pandas的数据结构Series 1.1 Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一 ...
Python之Pandas中Series、DataFrame实践
Python之Pandas中Series.DataFrame实践 1. pandas的数据结构Series 1.1 Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一 ...
Pandas中Series和DataFrame的索引
在对Series对象和DataFrame对象进行索引的时候要明确这么一个概念:是使用下标进行索引,还是使用关键字进行索引.比如list进行索引的时候使用的是下标,而dict索引的时候使用的是关键字. ...
[Python] Pandas 中 Series 和 DataFrame 的用法笔记
目录 1. Series对象自定义元素的行标签使用Series对象定义基于字典创建数据结构 2. DataFrame对象自定义行标签和列标签使用DataFrame对象可以基于字典创建数据结构 ...
Pandas中Series与Dataframe的区别
1. Series Series通俗来讲就是一维数组,索引(index)为每个元素的下标,值(value)为下标对应的值例如: arr = ['Tom', 'Nancy', 'Jack', 'Ton ...
pandas中series和dataframe之间的区别
series结构有索引,和列名组成,如果没有,那么程序会自动赋名为None series的索引名具有唯一性,索引可以数字和字符,系统会自动将他们转化为一个类型object. dataframe由索引和 ...
pandas中数据框DataFrame获取每一列最大值或最小值
1.python中数据框求每列的最大值和最小值 df.min() df.max()
Pandas中Series与Dataframe的初始化
(一)Series初始化 1.通过列表,index自动生成 se = pd.Series(['Tom', 'Nancy', 'Jack', 'Tony']) print(se) 2.通过列表,指定in ...
Pandas 数据结构Dataframe：基本概念及创建
"二维数组"Dataframe:是一个表格型的数据结构,包含一组有序的列,其列的值类型可以是数值.字符串.布尔值等. Dataframe中的数据以一个或多个二维块存放,不是列表.字 ...

随机推荐

SEO搜索引擎优化是什么？
㈠什么是SEO? 搜索引擎优化,又称为SEO,即Search Engine Optimization,它是一种通过分析搜索引擎的排名规律,了解各种搜索引擎怎样进行搜索.怎样抓取互联网页面.怎样确定特定 ...
51 Nod 1556计算(默慈金数的应用)
#include<bits/stdc++.h> #define mod 1000000007 using namespace std; typedef long long ll; ll m ...
【杂题】[CodeForces 1172F] Nauuo and Bug【数据结构】【线段树】
Description 给出一个长度为n的序列a和一个整数p 有m组询问,每组询问给出一个区间\([l,r]\) 你需要给出下面这个过程的结果 ans = 0 for i from l to r { ...
codevs 5960 信使x
题目描述 Description •战争时期,前线有n个哨所,每个哨所可能会与其他若干个哨所之间有通信联系.信使负责在哨所之间传递信息,当然,这是要花费一定时间的(以天为单位).指挥部设在第一个哨所. ...
DVWA--File Inclusion(不能远程包含的问题解决）
然后别以为这样就完了我被这样坑了一下午找到你对应版本的php 进去Ctrl+f 搜索url_allow——fopen 和include
【个推CTO谈数据智能】之我们理解的数据中台
引言在本系列的前面两篇文章(<数据智能时代来临:本质及技术体系要求>和<多维度分析系统的选型方法>)之中,我们概括性地阐述了对于数据智能的理解,并根据工作中团队涉及到的多维度 ...
Java中String.getBytes()
在Java中,String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组.这个表示在不通OS下,返回的东西不一样! String.getBytes(String decode) ...
分布式-信息方式-JMS大纲
一.简介 JMS即Java消息服务(Java Message Service)应用程序接口,是一个Java平台中关于面向消息中间件(MOM)的API,用于在两个应用程序之间,或分布式系统中发送消息, ...
vue跳转到指定位置
document.querySelector(id).scrollIntoView(true)//跳转到顶部 window.scrollTo(0, 0)
linux工作常用命令
修改文件后缀如将文件application.properties.sample改为application.properties,格式 mv 文件名称.{改前后缀,修改后的目标后缀} 定位到修改文 ...

pandas中的数据结构-DataFrame

pandas中的数据结构-DataFrame

DataFrame是什么？

DataFrame创建

从字典创建

从二维ndarray创建

DataFrame操作方法

查看数据集的头和尾

查看索引、列和y numpy 数组

修改索引index

修改列的标题

修改特定位置元素

选择数据

切片

修改

删除

排序

对下标排序

对于值排序

表格运算

比较运算

pandas中的数据结构-DataFrame的更多相关文章

随机推荐

热门专题