python panda::dataframe常用操作
1、条件查询:
result = df.query("((a==1 and b=="x") or c/d < 3))"
print result
2、遍历
a)根据索引遍历
for idx in df.index:
dd = df.loc[idx]
print(dd)
b)按行遍历
for i in range(0, len(df)):
dd = df.iloc[i]
print(dd)
3、对某列求均值
# 对“volume”列求均值
result = df["volume"].mean()
print(result)
4、按照指定列排序
result_df = df.sort_values(by="sales" , ascending=False)
print(result_df)
注意,以上排序,非inplace
5、提取特定行/列
如有数据:
code update_time last_price open_price ... option_gamma option_vega option_theta option_rho
42 HK.02018 2019-04-26 16:08:05 53.70 52.70 ... NaN NaN NaN NaN
15 HK.00151 2019-04-26 16:08:33 6.17 6.21 ... NaN NaN NaN NaN
14 HK.00101 2019-04-26 16:08:05 18.22 18.26 ... NaN NaN NaN NaN
a)按照索引提取
提取索引为42的行和所有列:
result = df.loc[42, :]
print(result)
result:
code update_time last_price open_price ... option_gamma option_vega option_theta option_rho
42 HK.02018 2019-04-26 16:08:05 53.70 52.70 ... NaN NaN NaN NaN
提取索引为15,42的数据, 只需要code和update_time两列:
result = df.loc[[15,42], [0,2]]
print(result)
result:
code update_time
42 HK.02018 2019-04-26 16:08:05
15 HK.00151 2019-04-26 16:08:33
b)按行提取
提取第2行的数据, 所有列:
result = df.iloc[1, :]
print(result)
result:
code update_time last_price open_price ... option_gamma option_vega option_theta option_rho
15 HK.00151 2019-04-26 16:08:33 6.17 6.21 ... NaN NaN NaN NaN
提取前2行的数据, 所有列:
result = df.iloc[0:2, :]
print(result)
result:
code update_time last_price open_price ... option_gamma option_vega option_theta option_rho
42 HK.02018 2019-04-26 16:08:05 53.70 52.70 ... NaN NaN NaN NaN
15 HK.00151 2019-04-26 16:08:33 6.17 6.21 ... NaN NaN NaN NaN
提取1、3行的数据, 只需要code和update_time两列:
result = df.iloc[[0,2], 0:2]
print(result)
result:
code update_time
42 HK.02018 2019-04-26 16:08:05
14 HK.00101 2019-04-26 16:08:05
6、复制列
df['col']=df['col1']+df['col2']
将col1和col2相除的结果加1,放入新的newcol列:
df['newcol']=df['col1']/df['col2']+1
7、重命名列
new_df = df.rename(columns={'oldName1': 'newName1', 'oldName2': 'newName2'})
print(new_df)
# inplace模式
df.rename(columns={'oldName1': 'newName1', 'oldName2': 'newName2'}, inplace=True)
print(df)
python panda::dataframe常用操作的更多相关文章
- 二叉树的python可视化和常用操作代码
二叉树是一个重要的数据结构, 本文基于"二叉查找树"的python可视化 pybst 包, 做了一些改造, 可以支持更一般的"二叉树"可视化. 关于二叉树和二叉 ...
- pyspark dataframe 常用操作
spark dataframe派生于RDD类,但是提供了非常强大的数据操作功能.当然主要对类SQL的支持. 在实际工作中会遇到这样的情况,主要是会进行两个数据集的筛选.合并,重新入库. 首先加 ...
- Python数据类型及常用操作
Python字符串类型 1.用途: 用来记录有描述性的状态.比如:人名,地址等. 2.定义方式: 创建字符串非常简单,在‘ ’,“ ”,‘’‘ ’‘’内一填写一系列的字符例如:msg='hello' ...
- Python字符串的常用操作学习
>>> name = "I love my job!" >>> name.capitalize() #首字母大写 'I love my job! ...
- Python集合的常用操作
字典常用的就是,他的去重. set集合是python的一个基本数据类型. set中的元素是不重复的.⽆无序的.⾥面的元素必须是可hash的(int, str, tuple,bool). 我们可以这样来 ...
- python os 模块常用操作
python 2.7 os 常用操作 官方document链接 文件和目录 os.access(path, mode) 读写权限测试 应用: try: fp = open("myfile&q ...
- 初识python: 字符串常用操作
直接上代码示例: #!/user/bin env python # author:Simple-Sir # time:20180914 # 字符串常用操作 name = 'lzh lyh' print ...
- R 语言的Dataframe常用操作
上节我们简单介绍了Dataframe的定义,这节我们具体来看一下Dataframe的操作 首先,数据框的创建函数为 data.frame( ),参考R语言的帮助文档,我们来了解一下data.frame ...
- python selenium 基本常用操作
最近学习UI自动化,把一些常用的方法总结一下,方便自己以后查阅需要.因本人水平有限,有不对之处多多包涵!欢迎指正! 一.xpath模糊匹配定位元素 武林至尊,宝刀屠龙刀(xpath),倚天不出(css ...
随机推荐
- ROS-PCL点云库的安装
网上各种说安装点云库还慢,中间出现一些没有依赖库的情况,但在我这里都是很顺利,难道是一开始安装了ROS的原因?不是很清楚,暂且将过程写下来. 一,下载PCL $ git clone https://g ...
- Python爬虫基础之认识爬虫
一.前言 爬虫Spider什么的,老早就听别人说过,感觉挺高大上的东西,爬网页,爬链接~~~dos黑屏的数据刷刷刷不断地往上冒,看着就爽,漂亮的校花照片,音乐网站的歌曲,笑话.段子应有尽有,全部都过来 ...
- djjango安装及其 操作命令
一 首先掌握HTTP协议 HTTP四大特性: 1 基于tcp/IP作用在应用层之上的协议 2 基于请求响应 3 无状态(不识别来的用户的状态) 4 无连接(请求完返回响应后就断开) 数据格式: 请求 ...
- Java Spring Boot VS .NetCore (七) 配置文件
Java Spring Boot VS .NetCore (一)来一个简单的 Hello World Java Spring Boot VS .NetCore (二)实现一个过滤器Filter Jav ...
- 期货大赛项目|八,ueditor的应用
百度开发的富文本编辑器还是很不错的,可以已经不维护了 下载ueditor1_4_3_3-utf8-net放到项目中 找到net文件夹下config.json 修改以下两行 "imageUrl ...
- SQL Server数据库中导入导出数据及结构时主外键关系的处理
2015-01-26 软件开发中,经常涉及到不同数据库(包括不同产品的不同版本)之间的数据结构与数据的导入导出.处理过程中会遇到很多问题,尤为突出重要的一个问题就是主从表之间,从表有外检约束,从而导致 ...
- 网页布局之flex
Flex是Flexible Box的缩写,意为“弹性布局”,用来为盒状模型提供最大的灵活性.设为Flex布局以后,子元素的float.clear和vertical-align属性将失效.使用flex ...
- Linux中Hadoop的环境搭建
一:下载安装 Hadoop 1.1:下载指定的Hadoop 1.2:通过XFTP把文件上传到master电脑bigData目录下 1.3:解压hadoop压缩文件 tar -xvf hadoop-2. ...
- BZOJ4665: 小w的喜糖 DP
对于这道题,首先每个人的位置并不影响结果 所以我们可以将相同颜色糖果的人放在一块处理 设 $f_{i,j}$ 表示处理到第 $i$ 种糖果至少有 $j$ 人的糖果和原先的类型相同 枚举当前种类中不满足 ...
- __x__(25)0907第四天__ overflow 父元素对溢出内容的处理
overflow 父元素对于溢出内容的处理 visible; 默认值,对于溢出内容,在父元素之外显示. hidden; 对于溢出内容,进行隐藏,不显示. scroll; 对于溢 ...