Pandas | 09 迭代

Pandas对象之间的基本迭代的行为取决于类型。当迭代一个系列时，它被视为数组式，基本迭代产生这些值。其他数据结构，如：DataFrame和Panel，遵循类似惯例，迭代对象的键。

简而言之，基本迭代(对于i在对象中)产生 -

Series - 值
DataFrame - 列标签
Pannel - 项目标签

迭代DataFrame

　　迭代DataFrame，默认迭代对象的键（列）。

import pandas as pd

import numpy as np

N=20

df = pd.DataFrame({

    'A': pd.date_range(start='2016-01-01',periods=N,freq='D'),

    'x': np.linspace(0,stop=N-1,num=N),

    'y': np.random.rand(N),

    'C': np.random.choice(['Low','Medium','High'],N).tolist(),

    'D': np.random.normal(100, 10, size=(N)).tolist()

    })

print(df)

print('\n')

for col in df:

   print (col)

输出结果：

            A     x         y       C           D
0  2016-01-01   0.0  0.433094  Medium  122.454137
1  2016-01-02   1.0  0.702406     Low   87.920907
2  2016-01-03   2.0  0.106648     Low  110.453026
3  2016-01-04   3.0  0.553946    High   93.357313
4  2016-01-05   4.0  0.055309  Medium  101.677134
5  2016-01-06   5.0  0.870506     Low   93.611441
6  2016-01-07   6.0  0.265124    High   89.684828
7  2016-01-08   7.0  0.608606  Medium  106.256583
8  2016-01-09   8.0  0.915061    High   87.611971
9  2016-01-10   9.0  0.403021  Medium  118.759460
10 2016-01-11  10.0  0.042113  Medium   96.181790
11 2016-01-12  11.0  0.740301     Low  105.394580
12 2016-01-13  12.0  0.996189     Low  101.069863
13 2016-01-14  13.0  0.204401  Medium  107.772976
14 2016-01-15  14.0  0.595775    High   93.862074
15 2016-01-16  15.0  0.449922  Medium   95.686896
16 2016-01-17  16.0  0.649613     Low   95.902673
17 2016-01-18  17.0  0.549016  Medium  103.786598
18 2016-01-19  18.0  0.428497  Medium   82.460432
19 2016-01-20  19.0  0.426844    High  107.196597

A
x
y
C
D

要遍历数据帧(DataFrame)中的行，可以使用以下函数：

iteritems() - 迭代(key，value)对
iterrows() - 将行迭代为(索引，系列)对
itertuples() - 以namedtuples的形式迭代行

iteritems()

　　将每个列作为键，将值与值作为键和列值，迭代为Series对象。

import pandas as pd

import numpy as np

df = pd.DataFrame(np.random.randn(4,3),columns=['col1','col2','col3'])

print(df)

print('\n')

for key,value in df.iteritems():

   print (key,value,'\n')

输出结果：

       col1      col2      col3
0  0.096004  1.836687  0.513612
1  0.506905 -0.042988 -0.438362
2 -1.425654  1.081005  0.182610
3 -0.746107 -0.971394 -0.204752

col1 0    0.096004
1    0.506905
2   -1.425654
3   -0.746107
Name: col1, dtype: float64 

col2 0    1.836687
1   -0.042988
2    1.081005
3   -0.971394
Name: col2, dtype: float64 

col3 0    0.513612
1   -0.438362
2    0.182610
3   -0.204752
Name: col3, dtype: float64

观察一下，单独迭代每个列作为系列中的键值对。

iterrows()

　　iterrows()返回迭代器，产生每个索引值以及包含每行数据的序列。

import pandas as pd

import numpy as np

df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])

for row_index,row in df.iterrows():

   print (row_index,row,'\n')

输出结果：

  col1    1.529759

   col2    0.762811

   col3   -0.634691

Name: 0, dtype: float64

  col1   -0.944087

   col2    1.420919

   col3   -0.507895

Name: 1, dtype: float64

  col1   -0.077287

   col2   -0.858556

   col3   -0.663385

Name: 2, dtype: float64

  col1    -1.638578

   col2     0.059866

   col3     0.493482

Name: 3, dtype: float64

注意 - 由于iterrows()遍历行，因此不会跨该行保留数据类型。0,1,2是行索引，col1，col2，col3是列索引。

itertuples()

itertuples()方法将为DataFrame中的每一行返回一个产生一个命名元组的迭代器。元组的第一个元素将是行的相应索引值，而剩余的值是行值。

import pandas as pd

import numpy as np

df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])

for row in df.itertuples():

    print (row)

输出结果：

Pandas(Index=0, col1=1.5297586201375899, col2=0.76281127433814944, col3=-0.6346908238310438)

Pandas(Index=1, col1=-0.94408735763808649, col2=1.4209186418359423, col3=-0.50789517967096232)

Pandas(Index=2, col1=-0.07728664756791935, col2=-0.85855574139699076, col3=-0.6633852507207626)

Pandas(Index=3, col1=0.65734942534106289, col2=-0.95057710432604969,col3=0.80344487462316527)

Pandas | 09 迭代的更多相关文章

pandas:数据迭代、函数应用
1.数据迭代 1.1 迭代行 (1)df.iterrows() for index, row in df[0:5].iterrows(): #需要两个变量承接数据 print(row) print(& ...
pandas优化
目录前言使用Datetime数据节省时间 pandas数据的循环操作使用itertuples() 和iterrows() 循环 Pandas的 .apply()方法矢量化操作:使用.isin( ...
Windows7WithSP1/TeamFoundationServer2012update4/SQLServer2012
[Info @09:03:33.737] ====================================================================[Info @ ...
ML第5周学习小结
本周收获总结一下本周学习内容: 1.学习了<深入浅出Pandas>的第五章:Pandas高级操作的两个内容数据迭代函数应用我的博客链接: pandas:数据迭代.函数应用 2.&l ...
如何迭代pandas dataframe的行
from:https://blog.csdn.net/tanzuozhev/article/details/76713387 How to iterate over rows in a DataFra ...
Pandas迭代
Pandas对象之间的基本迭代的行为取决于类型.当迭代一个系列时,它被视为数组式,基本迭代产生这些值.其他数据结构,如:DataFrame和Panel,遵循类似惯例迭代对象的键. 简而言之,基本迭代( ...
pandas 读取excle ，迭代
# -*-coding:utf-8 -*- import pandas as pd xls_file=pd.ExcelFile('D:\python_pro\\address_list.xlsx') ...
3.09课·········for穷举和迭代
for循环拥有两类:穷举和迭代穷举:把所有可能的情况都走一遍,使用if条件筛选出来满足条件的情况. 1.单位给发了一张150元购物卡,拿着到超市买三类洗化用品.洗发水15元,香皂2元,牙刷5元.求刚好 ...
numpy&pandas基础
numpy基础 import numpy as np 定义array In [156]: np.ones(3) Out[156]: array([1., 1., 1.]) In [157]: np.o ...

随机推荐

jar解压后重新打包
因为一些原因修改了jar中的配置文件,但用WinRAR压缩成zip文件后该后缀名为jar,发现重新压缩的文件不可用,所有这些情况下我们必须用jar重新打包. 配置Java环境,让jar命令可用: ja ...
【layui】【laydate】设置可以选择相同的年份范围
1.效果: 2.解决方法: 修改laydate.js源码全局查询T.prototype.setBtnStatus这个只有一个,就是点击控件时调用的事件,里面添加下面代码 if( this.confi ...
C++：const
const const是C++提供的一个强大的关键字,const的用法非常多,但总的来说,const的作用只有一个:保证被修饰的内容不会被程序所修改. const基本用法对一个类型的对象使用cons ...
IDEA 2019注册码(2020年4月过期)
IDEA 2019注册码(2020年4月过期) 812LFWMRSH-eyJsaWNlbnNlSWQiOiI4MTJMRldNUlNIIiwibGljZW5zZWVOYW1lIjoi5q2j54mII ...
从时序异常检测（Time series anomaly detection algorithm）算法原理讨论到时序异常检测应用的思考
1. 主要观点总结 0x1:什么场景下应用时序算法有效历史数据可以被用来预测未来数据,对于一些周期性或者趋势性较强的时间序列领域问题,时序分解和时序预测算法可以发挥较好的作用,例如: 四季与天气的关 ...
logstash 对配置文件conf敏感信息，密码等加密
logstash的配置文件conf经常会涉及敏感信息,比如ES,mysql的账户密码等,以下使用logstash导入mysql为例子,加密隐藏mysql的密码. 在向keystore中添加key及其s ...
javascript中的异步操作以及Promise和异步的关系
https://segmentfault.com/a/1190000004322358 Promise是异步编程的一种解决方案,比传统的解决方案--回调函数和事件--更合理和强大 https://se ...
.Net Core 学习路线图
今天看草根专栏这位大牛的微信公众号,上面分享了一张来自github的.net core学习路线图,贴在这里,好让自己学习有个方向,这么一大页竟然只是初级到高级的,我的个乖乖,太恐怖了. 感谢大牛 ...
MySQL UNION 操作符
本教程为大家介绍 MySQL UNION 操作符的语法和实例. 描述 MySQL UNION 操作符用于连接两个以上的 SELECT 语句的结果组合到一个结果集合中.多个 SELECT 语句会删除重复 ...
UNION ALL \UNION
(一)UNION ALL \UNION 的用法和区别 UNION UNION ALL 用途用于使用SELECT语句组合两个或多个表的结果集. 用于使用SELECT语句组合两个或多个表的 ...

Pandas | 09 迭代

迭代DataFrame

iteritems()

iterrows()

itertuples()

Pandas | 09 迭代的更多相关文章

随机推荐

热门专题