pandas入门（1）

import pandas as pd

import numpy as np

# 自动创建索引

obj = pd.Series([4, 7, -5, 2])

print(obj, type(obj))

print(obj.values)

print(obj.index)

# 自己创建索引

obj2 = pd.Series([2, 5, -32, 3], index=['a', 'b', 'c', 'd'])

print(obj2)

print(obj2['a'])  # 通过索引拿取值

print(obj2[['a', 'c']])

# 数组运算

print(obj2[obj2 > 0])

print(obj2 * 2)

print('b' in obj2)

# 可以通过字典来创建Series

sdata = {'zhangbo': 110, 'zhangwu': 150}

obj3 = pd.Series(sdata)

print(obj3)

# 自动找到对应的索引

states = ['zhangwu', 'zhangbo', 'zhangkai']

obj4 = pd.Series(sdata, index=states)

print(obj4)

print(pd.isnull(obj4))

print(pd.notnull(obj4))

print(obj4.isnull())

print(obj3 + obj4)

# name属性

obj4.name = 'sea'

obj4.index.name = 'state'

print(obj4)

# 索引通过赋值方式进行修改

obj.index = ['bob', 'steve', 'jeff', 'ryan']

print(obj)

# DataFrame第二种pandas中的数据类型，表格型数据结构，数据框

# 既有行索引，又有列索引

data = {

    'state': ['ohio', 'ohio', 'ohio', 'nevada', 'nevada'],

    'year': [2000, 2001, 2002, 2001, 2002],

    'pop': [1.5, 1.7, 3.6, 2.4, 2.9]

}

# 自动创建索引 0 - N-1

frame = pd.DataFrame(data)

print(frame)

# 按指定列进行排列

frame = pd.DataFrame(data, columns=['year', 'state', 'pop'])

print(frame)

# 传入的列找不到数据，则产生NA值, 可以自己创建索引

frame2 = pd.DataFrame(data, columns=['year', 'state', 'pop', 'debt'], index=['one', 'two', 'three', 'four', 'five'])

print(frame2)

print(frame2.columns)  # 单独打印列的名称

print(frame2['state'])  # 获取列

print(frame2.ix['two'])  # 获取行

frame2['debt'] = 16.5  # 修改列的值

frame2['debt'] = np.arange(5)   # 自增

print(frame2)

# 列表或者数组赋值给列, Series精确匹配

val = pd.Series([-23, 3, -4], index=['two', 'four', 'five'])

frame2['debt'] = val

print(frame2)

# 为不存在的列赋值会创造一个新列

frame2['eastern'] = frame2.state == 'ohio'

print(frame2)

del frame2['eastern']  # 关键字del用于删除列

print(frame2)

# 嵌套字典（字典的字典）

pop = {

    'nevada': {

        2001: 2.4,

        2002: 2.9

    },

    'ohio': {

        2000: 1.5,

        2001: 1.7,

        2002: 3.6

    }

}

frame3 = pd.DataFrame(pop)

print(frame3)  # 内层的键会合并形成最终的索引，如果指定索引，则不会这样

print(frame3.T)  # 进行转置

frame3 = pd.DataFrame(pop, index=[2001, 2002, 2003])  # 如果指定索引，则不会这样

print(frame3)

# data数据类型是可以切割的

pdata = {

    'ohio': frame3['ohio'][:-1],

    'nevada': frame3['nevada'][:2]

}

frame4 = pd.DataFrame(pdata)

print(frame4)

# 设置index和columns的name属性,这些信息也会被显现出来

frame3.index.name = 'year'

frame3.columns.name = 'state'

print(frame3)

print(frame3.values)  # 单独获取值

print(frame2.values)

pandas入门（1）的更多相关文章

利用Python进行数据分析——pandas入门
利用Python进行数据分析--pandas入门基于NumPy建立的 from pandas importSeries,DataFrame,import pandas as pd 一.两种数据结构 ...
Python 数据处理库 pandas 入门教程
Python 数据处理库 pandas 入门教程2018/04/17 · 工具与框架 · Pandas, Python 原文出处: 强波的技术博客 pandas是一个Python语言的软件包,在我们使 ...
利用python进行数据分析之pandas入门
转自https://zhuanlan.zhihu.com/p/26100976 目录: 5.1 pandas 的数据结构介绍5.1.1 Series5.1.2 DataFrame5.1.3索引对象5. ...
利用python进行数据分析--pandas入门2
随书练习,第五章 pandas入门2 # coding: utf-8 # In[1]: from pandas import Series,DataFrame import pandas as pd ...
利用python进行数据分析--pandas入门1
随书练习,第五章 pandas入门1 # coding: utf-8 # In[1]: from pandas import Series, DataFrame # In[2]: import pa ...
pandas 入门（3）
from pandas import Series, DataFrame, Index import numpy as np # 层次化索引对数据重塑和分组操作很有用 data = Series(n ...
< 利用Python进行数据分析 - 第2版 > 第五章 pandas入门读书笔记
<利用Python进行数据分析·第2版>第五章 pandas入门--基础对象.操作.规则 python引用.浅拷贝.深拷贝 / 视图.副本视图=引用副本=浅拷贝/深拷贝浅拷贝/深拷贝 ...
程序员用于机器学习编程的Python 数据处理库 pandas 入门教程
入门介绍 pandas适合于许多不同类型的数据,包括: · 具有异构类型列的表格数据,例如SQL表格或Excel数据 · 有序和无序(不一定是固定频率)时间序列数据. · 具有行列标签的任意矩阵数据( ...
《利用python进行数据分析》读书笔记--第五章 pandas入门
http://www.cnblogs.com/batteryhp/p/5006274.html pandas是本书后续内容的首选库.pandas可以满足以下需求: 具备按轴自动或显式数据对齐功能的数据 ...
pandas入门
[原]十分钟搞定pandas 本文是对pandas官方网站上<10 Minutes to pandas>的一个简单的翻译,原文在这里.这篇文章是对pandas的一个简单的介绍,详细的介 ...

随机推荐

2019 计蒜之道初赛第二场 B. 百度AI小课堂-上升子序列（简单) ( 实现)
题目背景 91029102 年 99 月 22 日,百度在 X 市 XX 中学举办的第一场 AI 知识小课堂大获好评!同学们对矩阵的掌握非常棒. 今天的 AI 知识小课堂的第二场开讲啦.本场 AI ...
Insomni'hack teaser 2019 - Misc - curlpipebash
参考链接 https://ctftime.org/task/7454 题目 Welcome to Insomni'hack teaser 2019! Execute this Bash command ...
gremlin语言语法--学习笔记
学习gremlin语言的目的:测试图数据,支持gremlin语句,所以必须系统学习一下!!!! 一.基础查询 g.V() 查询所有的顶点 g.V(3) 查询顶点id为3的点.字符串id的要到引号V(& ...
【NOIP2012模拟8.20】Memory
题目话说某一天,CD在爬树的时候发现了树干上有一大串奇怪的符文,于是好奇的CD就从头到尾看了一遍.看完一遍以后CD觉得,最后一段文字好像很眼熟,好像在前面见过.对于CD来说,一开始看到的符文会印象特 ...
linux运维、架构之路-KVM虚拟化技术
一.云计算概述云计算:是一种资源使用和交付模式虚拟化:一种具体的技术,用来将物理机虚拟成为多个相互独立的虚拟机.云计算不等于虚拟化,云计算是使用了虚拟化的技术做支撑二.KVM配置使用 1.系统环 ...
html的a链接的href怎样才另起一个页面，一个页面调到另一个html页面
在后面加上target ="_blank",就可以,正如: <ul class="nav navbar-nav navbar-right" style=& ...
android 开发架构学习
Android DataBinding(数据绑定)入门与实战 http://examplecode.cn/2018/07/20/android-databinding-01-introduction/ ...
mysql Alias操作符语法
mysql Alias操作符语法作用:为列名称和表名称指定别名大理石构件语法:SELECT column_name(s) FROM table_name AS alias_name mysql ...
ndn挖坑记(一)
目录 NDN是什么(简单记录) ndnSIM的安装编译运行的错误记录 NDN是什么(简单记录) NDN是命名数据网络的缩写,简单来是说以数据命名取代IP 的主体地位,数据名称取代了IP 作为网络中的 ...
c++复习——类（1）
1. 拷贝构造函数 //并没有搞懂先存着吧遇到实际情况再回来看看拷贝构造函数在以下三种情况被调用: (1)当用一个已经初始化过的对象去初始化同类另一个对象时, 拷贝构造函数被调用. Samp ...

pandas入门（1）

pandas入门（1）的更多相关文章

随机推荐

热门专题