pandas 入门（2）

from pandas import Series, DataFrame, Index

import numpy as np

from numpy import nan as NA

obj = Series(range(3), index=['a', 'b', 'c'])

print(obj)

index = obj.index

print(index)

print(index[1:])

# index[1] = 'd'  index对象时不可以被修改的  为了安全和共享

index = Index(np.arange(3))

obj2 = Series([1.5, -2.6, 0], index=index)

print(obj2.index is index)

# 嵌套字典（字典的字典）

pop = {

    'nevada': {

        2001: 2.4,

        2002: 2.9

    },

    'ohio': {

        2000: 1.5,

        2001: 1.7,

        2002: 3.6

    }

}

frame3 = DataFrame(pop)

frame3.index.name = 'year'

frame3.columns.name = 'state'

print(frame3)

print('ohio' in frame3.columns)

print(2003 in frame3.index)  # index有很多的方法和属性（有时间呢，可以摸索一下）

# reindex创建适应新索引的新对象（这里我不是很懂）

obj = Series([2.3, 4.5, -23.3, 4.3], index=['d', 'b', 'a', 'c'])

print(obj)

obj2 = obj.reindex(['a', 'b', 'c', 'd', 'e'])

print(obj2)  # 索引和值一一对应，根据新索引进行重排

obj2 = obj.reindex(['a', 'b', 'c', 'd', 'e'], fill_value=0)

print(obj2)  # 索引不存在，可以引入缺失值

obj3 = Series(['blue', 'purple', 'yellow'], index=[0, 2, 4])

print(obj3)

# obj3 = obj3.reindex(range(6), method='ffill')  # 或者pad

# print(obj3)  # 向前值填充

obj3 = obj3.reindex(range(6), method='bfill')  # 或者pad

print(obj3)  # 向后值填充

# 成员资格方法

data = DataFrame({'qu1': [1, 3, 4, 3, 4], 'qu2': [2, 3, 1, 2, 3], 'qu3': [1, 5, 2, 4, 4]})

print(data)

# 处理缺失数据

string = Series(['aar', 'art', np.nan, 'avo'])

print(string)

print(string.isnull())

# 过滤掉缺失数据

data = Series([1, NA, 3.5, NA, 7])

print(data.dropna())  # 过滤掉NA

print(data.notnull())

data = DataFrame([[1, 6.5, 3], [1, NA, NA], [NA, NA, NA], [NA, 6.5, 3]])

print(data)

print(data.dropna())   # 丢弃掉含有NA的所有行

print(data.dropna(how='all'))  # 丢我掉全为NA的行

data[4] = NA

print(data)

print(data.dropna(axis=1, how='all'))   # 丢弃掉全为NA的列

df = DataFrame(np.random.randn(7, 3))

df.ix[:4, 1] = NA  # 要钱也要后

df.ix[:2, 2] = NA

print(df)

print(df.dropna(thresh=3))  # thresh对应的值是观测的数据个数

# 填充缺失数据

print(df.fillna(0))

print(df.fillna({1: 0.4}))  # 指定的列进行填充

_ = df.fillna(0, inplace=True)  # 本地填充修改， 不产生新对象

print(df)

df = DataFrame(np.random.randn(6, 3))

df.ix[2:, 1] = NA  # 要钱也要后

df.ix[4:, 2] = NA

print(df)

print(df.fillna(method='ffill'))  # 向前填充

print(df.fillna(method='ffill', limit=2))  # 填充限制

data = Series([1, NA, 3.5, NA, 7])

print(data)

print(data.fillna(data.mean()))  # 用平均值填充na值

pandas 入门（2）的更多相关文章

利用Python进行数据分析——pandas入门
利用Python进行数据分析--pandas入门基于NumPy建立的 from pandas importSeries,DataFrame,import pandas as pd 一.两种数据结构 ...
Python 数据处理库 pandas 入门教程
Python 数据处理库 pandas 入门教程2018/04/17 · 工具与框架 · Pandas, Python 原文出处: 强波的技术博客 pandas是一个Python语言的软件包,在我们使 ...
利用python进行数据分析之pandas入门
转自https://zhuanlan.zhihu.com/p/26100976 目录: 5.1 pandas 的数据结构介绍5.1.1 Series5.1.2 DataFrame5.1.3索引对象5. ...
利用python进行数据分析--pandas入门2
随书练习,第五章 pandas入门2 # coding: utf-8 # In[1]: from pandas import Series,DataFrame import pandas as pd ...
利用python进行数据分析--pandas入门1
随书练习,第五章 pandas入门1 # coding: utf-8 # In[1]: from pandas import Series, DataFrame # In[2]: import pa ...
pandas 入门（3）
from pandas import Series, DataFrame, Index import numpy as np # 层次化索引对数据重塑和分组操作很有用 data = Series(n ...
< 利用Python进行数据分析 - 第2版 > 第五章 pandas入门读书笔记
<利用Python进行数据分析·第2版>第五章 pandas入门--基础对象.操作.规则 python引用.浅拷贝.深拷贝 / 视图.副本视图=引用副本=浅拷贝/深拷贝浅拷贝/深拷贝 ...
程序员用于机器学习编程的Python 数据处理库 pandas 入门教程
入门介绍 pandas适合于许多不同类型的数据,包括: · 具有异构类型列的表格数据,例如SQL表格或Excel数据 · 有序和无序(不一定是固定频率)时间序列数据. · 具有行列标签的任意矩阵数据( ...
《利用python进行数据分析》读书笔记--第五章 pandas入门
http://www.cnblogs.com/batteryhp/p/5006274.html pandas是本书后续内容的首选库.pandas可以满足以下需求: 具备按轴自动或显式数据对齐功能的数据 ...
pandas入门
[原]十分钟搞定pandas 本文是对pandas官方网站上<10 Minutes to pandas>的一个简单的翻译,原文在这里.这篇文章是对pandas的一个简单的介绍,详细的介 ...

随机推荐

python 导入模块、包
1. 模块:一个有逻辑的python文件,包含变量.函数.类等.2. 包:一个包含__init__.py的文件夹,存放多个模块 import 本质是路径搜索,查找sys.path下有无你导入的 pac ...
java Character类源码分析
一.使用构建Character对象: public class CharTest { public static void main(String[] args) { Character c1 = ...
git概述（二）
分支管理分支在实际中有什么用呢?假设你准备开发一个新功能,但是需要两周才能完成,第一周你写了50%的代码,如果立刻提交,由于代码还没写完,不完整的代码库会导致别人不能干活了.如果等代码全部写完再一次 ...
原生js禁止页面滚动
// 开启.禁止页面滚动 bodyScroll: { e(e) { e.preventDefault();// 注意此处代码片段必须这样提出来已保证传入下边两个事件的处理程序一样才生效,分别写到事件处 ...
【LuoguP4770】[NOI2018] 你的名字
题目链接题意简述给定一个串 \(S\) 多组询问 , 每次给定一个串 \(T\) 和一个区间 \([l,r]\) 求串\(T\) 有多少个本质不同的子串满足不是 \(S[l...r]\) 的子 ...
iOS Core Image-----十行代码实现微信朋友圈模糊效果
昨天下午微信的朋友圈着实火了一把,在这之后好多程序员都通过抓包工具看到了原图,但是我却在想,网上说是在移动前端做到的那是怎么做到的呢,经过一些学习,终于掌握了一些Core Image的知识,做出了相应 ...
虚拟机安装Windows系统，再安装orcale
本文出自:http://www.cnblogs.com/2186009311CFF/p/8724441.html 1.创建新虚拟机 2.选择自定义 3.选择workstation 5.x(据安装的系统 ...
linux 阿里云oss命令ossutil64 同步文件
官方使用文档: https://help.aliyun.com/document_detail/120057.html?spm=a2c4g.11186623.4.2.1c35448ak8Ez8e [r ...
warp（图像仿射变换）
仿射变换是一种二维坐标(x,y)到二维坐标(u,v)的线性变换. 对应的齐次坐标矩阵表示形式为: 仿射变换特点: 直线经仿射变换后依然为直线: ’直线之间的相对位置关系保持不变,平行线经仿射变换后依然 ...
双系统使用Linux引导
今天在装linux的window双系统时,出现在无法使用linux引导的问题,开机总是自动进windows,照理来说我先装的window,后装的linux,应该是开机进grub引导才对.在主板的boo ...

pandas 入门（2）

pandas 入门（2）的更多相关文章

随机推荐

热门专题