pandas 1 基本介绍

import numpy as np

import pandas as pd

pd.Series(）构造数据

s = pd.Series([1, 3, 5, np.nan, 44, 1])

print(s)

# 0     1.0

# 1     3.0

# 2     5.0

# 3     NaN

# 4    44.0

# 5     1.0

# dtype: float64

pd.date_range() 生成数据

dates = pd.date_range('20190225', periods=2)

print(dates)  

# DatetimeIndex(['2019-02-25', '2019-02-26'], dtype='datetime64[ns]', freq='D')

pd.DataFrame() 构造数据

df = pd.DataFrame(np.random.randn(2, 4), index=dates, columns=['a', 'b', 'c', 'd'])

print(df)

#                    a         b         c         d

# 2019-02-25  1.236639 -0.918432 -0.211460  1.834082

# 2019-02-26  1.191895 -1.680464  0.863866  0.171246

pd.DataFrame() 构造数据

df1 = pd.DataFrame(np.arange(12).reshape(3, 4)

print(df1)

#    0  1   2   3

# 0  0  1   2   3

# 1  4  5   6   7

# 2  8  9  10  11

pd.DataFrame() 构造数据

df2 = pd.DataFrame({'A': 1.,

                    'B': pd.Timestamp('20130102'),

                    'C': pd.Series(1, index=list(range(5)), dtype='float32'),

                    'D': np.array([3] * 5, dtype='int32'),

                    'E': pd.Categorical(["test", "train", "test", "train", 'yzn']),

                    'F': 'foo'})

print(df2)

#      A          B    C  D      E    F

# 0  1.0 2013-01-02  1.0  3   test  foo

# 1  1.0 2013-01-02  1.0  3  train  foo

# 2  1.0 2013-01-02  1.0  3   test  foo

# 3  1.0 2013-01-02  1.0  3  train  foo

# 4  1.0 2013-01-02  1.0  3    yzn  foo

属性 df2.dtypes df2.index df2.columns

df2.values df2.describe() df2.T

df.sort_index(axis=1, ascending=False) df2.sort_values(by='E')

print(df2.dtypes)

# A           float64

# B    datetime64[ns]

# C           float32

# D             int32

# E          category

# F            object

# dtype: object

print(df2.index)

# Int64Index([0, 1, 2, 3, 4], dtype='int64')

print(df2.columns)

# Index(['A', 'B', 'C', 'D', 'E', 'F'], dtype='object')

print(df2.values)

# [[1.0 Timestamp('2013-01-02 00:00:00') 1.0 3 'test' 'foo']

#  [1.0 Timestamp('2013-01-02 00:00:00') 1.0 3 'train' 'foo']

#  [1.0 Timestamp('2013-01-02 00:00:00') 1.0 3 'test' 'foo']

#  [1.0 Timestamp('2013-01-02 00:00:00') 1.0 3 'train' 'foo']

#  [1.0 Timestamp('2013-01-02 00:00:00') 1.0 3 'yzn' 'foo']]

print(df2.describe())

#          A    C    D

# count  5.0  5.0  5.0

# mean   1.0  1.0  3.0

# std    0.0  0.0  0.0

# min    1.0  1.0  3.0

# 25%    1.0  1.0  3.0

# 50%    1.0  1.0  3.0

# 75%    1.0  1.0  3.0

# max    1.0  1.0  3.0

print(df2.T)

#                      0  ...                    4

# A                    1  ...                    1

# B  2013-01-02 00:00:00  ...  2013-01-02 00:00:00

# C                    1  ...                    1

# D                    3  ...                    3

# E                 test  ...                  yzn

# F                  foo  ...                  foo

# [6 rows x 5 columns]

print(df.sort_index(axis=1, ascending=False))

#                    d         c         b         a

# 2019-02-25 -0.086707  0.388089  0.513976 -0.148502

# 2019-02-26 -0.237655 -0.799583 -1.722373  0.318766

print(df.sort_index(axis=0, ascending=False))

#                    a         b         c         d

# 2019-02-26 -2.117756  0.453841 -2.900436  1.061481

# 2019-02-25 -0.974467  0.598005 -0.552265 -2.487490

print(df2.sort_values(by='E'))

#      A          B    C  D      E    F

# 0  1.0 2013-01-02  1.0  3   test  foo

# 2  1.0 2013-01-02  1.0  3   test  foo

# 1  1.0 2013-01-02  1.0  3  train  foo

# 3  1.0 2013-01-02  1.0  3  train  foo

# 4  1.0 2013-01-02  1.0  3    yzn  foo

END

pandas 1 基本介绍的更多相关文章

numpy、pandas、scipy介绍
https://blog.csdn.net/LOLITA0164/article/details/80195124 numpy简介NumPy(Numeric Python)是一个Python包.它是一 ...
pandas数据结构和介绍第一天
pandans另种主要的数据结构Series和DateFranme 1,Series 仅由一组数据就而已产生简单的Series 2)Series 有index和values属性,表达索引对象 3)设置 ...
Pandas 计算工具介绍
# 导入相关库 import numpy as np import pandas as pd 统计函数最常见的计算工具莫过于一些统计函数了.首先构建一个包含了用户年龄与收入的 DataFrame i ...
pandas的数据结构介绍（一）—— Series
pandas两个主要数据结构之一--Series 类似于一维数组,由一组数据和与其相关的一组索引组成 obj = Series([4, 7, -5, 3], index=['d', 'b', 'a', ...
【转】十分钟搞定pandas
原文链接:http://www.cnblogs.com/chaosimple/p/4153083.html 关于pandas的入门介绍,比较全,也比较实在,特此记录~ 还有关于某同学的pandas学习 ...
python数据分析之pandas库的Series应用
一.pandas的数据结构介绍 1. Series 1.1 Series是由一种类似于一维数组的对象,它由一组数据以及一组与之相关的数据索引构成.仅由一组数据可产生最简单的Series. from p ...
利用python进行数据分析之pandas库的应用（一）
一.pandas的数据结构介绍 Series Series是由一种类似于一维数组的对象,它由一组数据以及一组与之相关的数据索引构成.仅由一组数据可产生最简单的Series. obj=Series([4 ...
【译】10分钟学会Pandas
十分钟学会Pandas 这是关于Pandas的简短介绍主要面向新用户.你可以参考Cookbook了解更复杂的使用方法习惯上,我们这样导入: In [1]: import pandas as pd I ...
数据分析之pandas教程-----概念篇
目录 1 pandas基本概念 1.1 pandas数据结构剖析 1.1.1 Series 1.1.2 DataFrame 1.1.3 索引 1.1.4 pandas基本操作 1.1.4. ...

随机推荐

CF 689D - Friends and Subsequences
689D - Friends and Subsequences 题意: 大致跟之前题目一样,用ST表维护a[]区间max,b[]区间min,找出多少对(l,r)使得maxa(l,r) == minb( ...
TensorFlow+实战Google深度学习框架学习笔记（7）-----队列与多线程
一.创建一个队列: FIFOQueue:先进先出 RandomShuffleQueue:会将队列中的元素打乱,每次出列操作得到的是从当前队列所有元素中随机选择的一个. 二.操作一个队列的函数: enq ...
Kz.layedit-layui.layedit富文本编辑器拓展
项目介绍首先欢迎使用 Kz.layedit!本项目基于layui.layedit富文本编辑器,在其之上拓展而来. 新增功能 html源码模式.插入hr水平线.段落格式.字体颜色.字体背景色.批量上传 ...
layui select change
<select lay-filter="test"></select> layui.use([ 'form'], function() { var form ...
Layui父页面向子页面传参
废话不多说!直接上代码! 父窗体js $('.mytable').on('click', '.editRow', function () { var table = $('#table_id_exam ...
Vue系列（三）：组件及数据传递、路由、单文件组件、vue-cli脚手架
上一篇:Vue系列(二):发送Ajax.JSONP请求.Vue生命周期及实例属性和方法.自定义指令与过渡一. 组件component 1. 什么是组件? 组件(Component)是 Vue.js ...
spring web mvc第一天
spring web mvc 感觉就是高大上啊!啥都是配置文件就能够了.所以第一步就是弄清楚配置文件使用和总体框架的流程! Spring web mvc最重要的当然是Controller,也就是首先 ...
Android Studio 修改注释模板中的${USER}变量以及修改默认的头部注释
引言通常我们创建类文件都会自动生成一段头部注释. 有时候这不是我们想要的效果. 它默认是Created By XXX. 而我们要的是@author XXX. 而且这里面的XXX是系统的的用户名,不一 ...
ThinkPHP5.0框架开发--第4章 TP5.0路由
ThinkPHP5.0框架开发--第4章 TP5.0路由第4章 TP5.0 路由 ================================================== 上次复习 1. ...
DNS Tunnel判定方法
DNS Tunnel判定方法: 1.查询DNS请求的域名是否存在备案: 2.查询DNS请求的域名情报信息(以及域名的alex排名): 3.查看相同主域名下子域名编码格式及长度:(存在Base32和Ba ...

pandas 1 基本介绍

pd.Series(） 构造数据

pd.date_range() 生成数据

pd.DataFrame() 构造数据

pd.DataFrame() 构造数据

pd.DataFrame() 构造数据

属性 df2.dtypes df2.index df2.columns

df2.values df2.describe() df2.T

df.sort_index(axis=1, ascending=False) df2.sort_values(by='E')

pandas 1 基本介绍的更多相关文章

随机推荐

热门专题

pd.Series(）构造数据