Pandas对象之间的基本迭代的行为取决于类型。当迭代一个系列时,它被视为数组式,基本迭代产生这些值。其他数据结构,如:DataFramePanel,遵循类似惯例,迭代对象的键。

简而言之,基本迭代(对于i在对象中)产生 -

  • Series - 值
  • DataFrame - 列标签
  • Pannel - 项目标签

迭代DataFrame

  迭代DataFrame默认迭代对象的键(列)。

import pandas as pd
import numpy as np N=20 df = pd.DataFrame({
'A': pd.date_range(start='2016-01-01',periods=N,freq='D'),
'x': np.linspace(0,stop=N-1,num=N),
'y': np.random.rand(N),
'C': np.random.choice(['Low','Medium','High'],N).tolist(),
'D': np.random.normal(100, 10, size=(N)).tolist()
}) print(df)
print('\n') for col in df:
print (col)

输出结果:

            A     x         y       C           D
0 2016-01-01 0.0 0.433094 Medium 122.454137
1 2016-01-02 1.0 0.702406 Low 87.920907
2 2016-01-03 2.0 0.106648 Low 110.453026
3 2016-01-04 3.0 0.553946 High 93.357313
4 2016-01-05 4.0 0.055309 Medium 101.677134
5 2016-01-06 5.0 0.870506 Low 93.611441
6 2016-01-07 6.0 0.265124 High 89.684828
7 2016-01-08 7.0 0.608606 Medium 106.256583
8 2016-01-09 8.0 0.915061 High 87.611971
9 2016-01-10 9.0 0.403021 Medium 118.759460
10 2016-01-11 10.0 0.042113 Medium 96.181790
11 2016-01-12 11.0 0.740301 Low 105.394580
12 2016-01-13 12.0 0.996189 Low 101.069863
13 2016-01-14 13.0 0.204401 Medium 107.772976
14 2016-01-15 14.0 0.595775 High 93.862074
15 2016-01-16 15.0 0.449922 Medium 95.686896
16 2016-01-17 16.0 0.649613 Low 95.902673
17 2016-01-18 17.0 0.549016 Medium 103.786598
18 2016-01-19 18.0 0.428497 Medium 82.460432
19 2016-01-20 19.0 0.426844 High 107.196597 A
x
y
C
D

要遍历数据帧(DataFrame)中的,可以使用以下函数:

  • iteritems() - 迭代(key,value)
  • iterrows() - 将行迭代为(索引,系列)对
  • itertuples() - 以namedtuples的形式迭代行

iteritems()

  将每个列作为键,将值与值作为键和列值,迭代为Series对象。

import pandas as pd
import numpy as np df = pd.DataFrame(np.random.randn(4,3),columns=['col1','col2','col3']) print(df)
print('\n') for key,value in df.iteritems():
print (key,value,'\n')

输出结果:

       col1      col2      col3
0 0.096004 1.836687 0.513612
1 0.506905 -0.042988 -0.438362
2 -1.425654 1.081005 0.182610
3 -0.746107 -0.971394 -0.204752 col1 0 0.096004
1 0.506905
2 -1.425654
3 -0.746107
Name: col1, dtype: float64 col2 0 1.836687
1 -0.042988
2 1.081005
3 -0.971394
Name: col2, dtype: float64 col3 0 0.513612
1 -0.438362
2 0.182610
3 -0.204752
Name: col3, dtype: float64

观察一下,单独迭代每个列作为系列中的键值对。

iterrows()

  iterrows()返回迭代器,产生每个索引值以及包含每行数据的序列。

import pandas as pd
import numpy as np df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
for row_index,row in df.iterrows():
print (row_index,row,'\n')

输出结果:

  col1    1.529759
col2 0.762811
col3 -0.634691
Name: 0, dtype: float64 col1 -0.944087
col2 1.420919
col3 -0.507895
Name: 1, dtype: float64 col1 -0.077287
col2 -0.858556
col3 -0.663385
Name: 2, dtype: float64
col1 -1.638578
col2 0.059866
col3 0.493482
Name: 3, dtype: float64
 

注意 - 由于iterrows()遍历行,因此不会跨该行保留数据类型。0,1,2是行索引,col1col2col3是列索引。

itertuples()

itertuples()方法将为DataFrame中的每一行返回一个产生一个命名元组的迭代器元组的第一个元素将是行的相应索引值,而剩余的值是行值。

import pandas as pd
import numpy as np df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
for row in df.itertuples():
print (row)

输出结果:

Pandas(Index=0, col1=1.5297586201375899, col2=0.76281127433814944, col3=-0.6346908238310438)
Pandas(Index=1, col1=-0.94408735763808649, col2=1.4209186418359423, col3=-0.50789517967096232)
Pandas(Index=2, col1=-0.07728664756791935, col2=-0.85855574139699076, col3=-0.6633852507207626)
Pandas(Index=3, col1=0.65734942534106289, col2=-0.95057710432604969,col3=0.80344487462316527)

Pandas | 09 迭代的更多相关文章

  1. pandas:数据迭代、函数应用

    1.数据迭代 1.1 迭代行 (1)df.iterrows() for index, row in df[0:5].iterrows(): #需要两个变量承接数据 print(row) print(& ...

  2. pandas优化

    目录 前言 使用Datetime数据节省时间 pandas数据的循环操作 使用itertuples() 和iterrows() 循环 Pandas的 .apply()方法 矢量化操作:使用.isin( ...

  3. Windows7WithSP1/TeamFoundationServer2012update4/SQLServer2012

    [Info   @09:03:33.737] ====================================================================[Info   @ ...

  4. ML第5周学习小结

    本周收获 总结一下本周学习内容: 1.学习了<深入浅出Pandas>的第五章:Pandas高级操作的两个内容 数据迭代 函数应用 我的博客链接: pandas:数据迭代.函数应用 2.&l ...

  5. 如何迭代pandas dataframe的行

    from:https://blog.csdn.net/tanzuozhev/article/details/76713387 How to iterate over rows in a DataFra ...

  6. Pandas迭代

    Pandas对象之间的基本迭代的行为取决于类型.当迭代一个系列时,它被视为数组式,基本迭代产生这些值.其他数据结构,如:DataFrame和Panel,遵循类似惯例迭代对象的键. 简而言之,基本迭代( ...

  7. pandas 读取excle ,迭代

    # -*-coding:utf-8 -*- import pandas as pd xls_file=pd.ExcelFile('D:\python_pro\\address_list.xlsx') ...

  8. 3.09课·········for穷举和迭代

    for循环拥有两类:穷举和迭代穷举:把所有可能的情况都走一遍,使用if条件筛选出来满足条件的情况. 1.单位给发了一张150元购物卡,拿着到超市买三类洗化用品.洗发水15元,香皂2元,牙刷5元.求刚好 ...

  9. numpy&pandas基础

    numpy基础 import numpy as np 定义array In [156]: np.ones(3) Out[156]: array([1., 1., 1.]) In [157]: np.o ...

随机推荐

  1. jar解压后重新打包

    因为一些原因修改了jar中的配置文件,但用WinRAR压缩成zip文件后该后缀名为jar,发现重新压缩的文件不可用,所有这些情况下我们必须用jar重新打包. 配置Java环境,让jar命令可用: ja ...

  2. 【layui】【laydate】设置可以选择相同的年份范围

    1.效果: 2.解决方法: 修改laydate.js源码 全局查询T.prototype.setBtnStatus这个只有一个,就是点击控件时调用的事件,里面添加下面代码 if( this.confi ...

  3. C++:const

    const const是C++提供的一个强大的关键字,const的用法非常多,但总的来说,const的作用只有一个:保证被修饰的内容不会被程序所修改. const基本用法 对一个类型的对象使用cons ...

  4. IDEA 2019注册码(2020年4月过期)

    IDEA 2019注册码(2020年4月过期) 812LFWMRSH-eyJsaWNlbnNlSWQiOiI4MTJMRldNUlNIIiwibGljZW5zZWVOYW1lIjoi5q2j54mII ...

  5. 从时序异常检测(Time series anomaly detection algorithm)算法原理讨论到时序异常检测应用的思考

    1. 主要观点总结 0x1:什么场景下应用时序算法有效 历史数据可以被用来预测未来数据,对于一些周期性或者趋势性较强的时间序列领域问题,时序分解和时序预测算法可以发挥较好的作用,例如: 四季与天气的关 ...

  6. logstash 对配置文件conf敏感信息,密码等加密

    logstash的配置文件conf经常会涉及敏感信息,比如ES,mysql的账户密码等,以下使用logstash导入mysql为例子,加密隐藏mysql的密码. 在向keystore中添加key及其s ...

  7. javascript中的异步操作以及Promise和异步的关系

    https://segmentfault.com/a/1190000004322358 Promise是异步编程的一种解决方案,比传统的解决方案--回调函数和事件--更合理和强大 https://se ...

  8. .Net Core 学习路线图

    今天看  草根专栏 这位大牛的微信公众号,上面分享了一张来自github的.net core学习路线图,贴在这里,好让自己学习有个方向,这么一大页竟然只是初级到高级的,我的个乖乖,太恐怖了. 感谢大牛 ...

  9. MySQL UNION 操作符

    本教程为大家介绍 MySQL UNION 操作符的语法和实例. 描述 MySQL UNION 操作符用于连接两个以上的 SELECT 语句的结果组合到一个结果集合中.多个 SELECT 语句会删除重复 ...

  10. UNION ALL \UNION

    (一)UNION ALL \UNION 的用法和区别   UNION UNION    ALL 用途   用于使用SELECT语句组合两个或多个表的结果集. 用于使用SELECT语句组合两个或多个表的 ...