Pandas 的使用

1. 访问df结构中某条记录使用loc或者iloc属性。loc是按照index或者columns的具体值，iloc是按照其序值。访问类似于ndarray的访问，用序列分别表示一维和二维的位置。

　　例如：missing_data.loc['MasVnrType']　　访问index为'MasVnrType'的行(如果有多行，才需要两对中括号，里面的中括号表示index列表

　　　　　missing_data.loc['MasVnrType', 'Total']　　用来访问index为'MasVnrType'，columns为'Total'的数据

　　　　　missing_data.loc[['MasVnrType', 'MasVnrArea'], ['Total']]　　访问index为'MasVnrType', 'MasVnrArea', columns为'Total'的数据

　　　　　missing_data.iloc[[1]]　　表示index序值为1的记录（0-indexed）

In [1]: df = DataFrame(randn(5,2),index=range(0,10,2),columns=list('AB'))

In [2]: df

Out[2]:

          A         B

 1.068932 -0.794307

-0.470056  1.192211

-0.284561  0.756029

 1.037563 -0.267820

-0.538478 -0.800654

In [5]: df.iloc[[2]]

Out[5]:

          A         B

-0.284561  0.756029

In [6]: df.loc[[2]]

Out[6]:

          A         B

-0.470056  1.192211

示例代码

2. 对数据变量进行标准正态化分布类 sklearn.preprocessing.StandardScaler http://sklearn.lzjqsdd.com/modules/preprocessing.html

3. Pandas 中的空值用 None 表示

4. 两个逻辑值序列求交或者并用 & 符号或者 | 符号

5. NaN 参与数值运算的结果仍然为 NaN

6. 如果需要在 IPython Notebook 中显示作图，需要加上 %matplotlib inline

7. 将属性值作为列名进行行列转换

　　1. MultiIndex 对象

　　　　构建有两种方式，一种是通过 index 元组的方式，一种是通过多维列表交叉组合的方式。

　　2. 在通过 Series 的 unstack 方法将某一级标签转换到 columns 上。

　　　　level 参数指定转换的标签级，-1表示最里面一级。

8. 如何改变 index 或 columns 的顺序

　　1. 一种方式是通过 reindex_axis 函数

　　2. 另外一种方式是通过重新赋值来改变

　　　　test_df = test_df[train_df.columns]

　　　　改变 index 顺序：test_df = test_df.loc[index]

9. 将带有 multi-level index 的 DataFrame 对象的 index 转换为对应的 columns 插入到原本的 DataFrame 中。

　　pd.DataFrame.reset_index() 函数可以完成上述功能

　　也可以时使用 MultiIndex 对象的 to_frame() 函数直接将 MultiIndex 转换为 DataFrame。

Pandas 的使用的更多相关文章

pandas基础-Python3
未完 for examples: example 1: # Code based on Python 3.x # _*_ coding: utf-8 _*_ # __Author: "LEM ...
10 Minutes to pandas
摘要一.创建对象二.查看数据三.选择和设置四.缺失值处理五.相关操作六.聚合七.重排(Reshaping) 八.时间序列九.Categorical类型十.画图十一 ...
利用Python进行数据分析(15) pandas基础: 字符串操作
字符串对象方法 split()方法拆分字符串: strip()方法去掉空白符和换行符: split()结合strip()使用: "+"符号可以将多个字符串连接起来: join( ...
利用Python进行数据分析(10) pandas基础: 处理缺失数据
数据不完整在数据分析的过程中很常见. pandas使用浮点值NaN表示浮点和非浮点数组里的缺失数据. pandas使用isnull()和notnull()函数来判断缺失情况. 对于缺失数据一般处理 ...
利用Python进行数据分析(12) pandas基础: 数据合并
pandas 提供了三种主要方法可以对数据进行合并: pandas.merge()方法:数据库风格的合并: pandas.concat()方法:轴向连接,即沿着一条轴将多个对象堆叠到一起: 实例方法c ...
利用Python进行数据分析(9) pandas基础: 汇总统计和计算
pandas 对象拥有一些常用的数学和统计方法. 例如,sum() 方法,进行列小计: sum() 方法传入 axis=1 指定为横向汇总,即行小计: idxmax() 获取最大值对应的索 ...
利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
一.reindex() 方法:重新索引针对 Series 重新索引指的是根据index参数重新进行排序. 如果传入的索引值在数据里不存在,则不会报错,而是添加缺失值的新行. 不想用缺失值,可以用 ...
利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍
一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析.它提供了大量高级的数据结构和对数据处理的方法. pandas 有两个主要的数据结构 ...
pandas.DataFrame对行和列求和及添加新行和列
导入模块: from pandas import DataFrame import pandas as pd import numpy as np 生成DataFrame数据 df = DataFra ...
pandas.DataFrame排除特定行
使用Python进行数据分析时,经常要使用到的一个数据结构就是pandas的DataFrame 如果我们想要像Excel的筛选那样,只要其中的一行或某几行,可以使用isin()方法,将需要的行的值以列 ...

随机推荐

Solr 整合
1. Solr 与 Lucene 的区别 Lucene是一个开发源代码的全文检索引擎工具包,它不是一个完整的全文检索引擎,Lucene 提供了完整的查询引擎和索引引擎,目的是为软件开发人员提供一个简 ...
css冲突2 要关闭的css在项目代码以外，但是是通过<link>标签引入的css（例如bootstrap）：解决方法，在APP.css中使用全局样式
css冲突,导致html字体过小. 通过浏览器检查发现,导致字体过小的css来自bootstrap. 现要关闭bootstrap的css: 直接在APP.css中添加: html{ font-size ...
SQLALchemy的其他常用操作
使用连接池的两种方式第一种方式: 直接从SessionFactory里获取,此时如果需要开启多个进程,那么创建连接池的代码一定要放在循环里面不然的话每个进程都是用一个session了 from s ...
python web框架 Django的APP以及目录介绍 2
app: migrations 数据修改表结构 admin Django为我们提供的后台管理 apps 配置当前app models ORM,写指定的类通过命令可以创建数据库结构 tests 单元测 ...
finecms万能标签list列表使用方法
我们在用finecms建站时经常会用到调用文章列表的功能,这时我们可以用万能标签list来实现,当然还可以调用其他一些数据,下面我们就来看看list函数的相关参数和使用方法 action 支持&quo ...
KDDCUP CTR预测比赛总结
赛题与数据介绍给定查询和用户信息后预测广告点击率搜索广告是近年来互联网的主流营收来源之一.在搜索广告背后,一个关键技术就是点击率预测-----pCTR(predict the click-thro ...
(转)CreateThread与_beginthread，内存泄漏为何因（原帖排版有些不好，所以我稍微整理下）
在写c++代码时,一直牢记着一句话:决不应该调用CreateThread. 应该使用Visual C++运行时库函数_beginthreadex.好像CreateThread函数就 ...
php now 5.2 升级5.3
简单说明在WIN上有时候需要测试一些PHP程序,又不会自行独立配置环境,那么PHPNow是非常好的选择. PHPNow自带的PHP版本为5.2.14,而最后一次更新在于2010-9-22,PHP5. ...
Extjs添加行双击事件
var grid = new Ext.grid.GridPanel({ store: store, trackMouseOver: false, disableSelection: true, aut ...
lower_bound()函数,upper_bound()函数
1.查找:STL中关于二分查找的函数有三个lower_bound .upper_bound .binary_search .这三个函数都运用于有序区间(当然这也是运用二分查找的前提),下面记录一下这两 ...

Pandas 的使用

Pandas 的使用的更多相关文章

随机推荐

热门专题