pandas函数应用
1、管道函数
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2018/5/24 15:03
# @Author : zhang chao
# @File : s.py #pipe管道函数的应用
import pandas as pd
import numpy as np def adder(ele1,ele2):
return ele1+ele2 df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])
print(df)
df2=df.pipe(adder,2)#df中每一个元素都加2
print('-'*100)
print("df.pipe(adder,2) df中每一个元素都加2")
print (df2) D:\Download\python3\python3.exe D:/Download/pycharmworkspace/s.py
col1 col2 col3
0 -0.541685 -1.009440 -1.680244
1 -0.881437 0.022469 0.911686
2 0.930035 1.073783 0.096894
3 -1.282204 -0.039941 0.147482
4 -1.743847 -1.187832 -0.402219
----------------------------------------------------------------------------------------------------
df.pipe(adder,2) df中每一个元素都加2
col1 col2 col3
0 1.458315 0.990560 0.319756
1 1.118563 2.022469 2.911686
2 2.930035 3.073783 2.096894
3 0.717796 1.960059 2.147482
4 0.256153 0.812168 1.597781 Process finished with exit code 0
2、
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2018/5/24 15:03
# @Author : zhang chao
# @File : s.py #可以使用apply()方法沿DataFrame或Panel的轴应用任意函数,它与描述性统计方法一样,采用可选的轴参数。
# 默认情况下,操作按列执行,将每列列为数组。
import pandas as pd
import numpy as np df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])
print (df)
print('-'*100)
print("df1=df.apply(np.mean)=df.apply(np.mean,axis=0) 默认按列执行操作:")
df1=df.apply(np.mean)
print (df1)
print('-'*100)
print("df2=df.apply(np.mean,axis=1) 按行执行操作:")
df2=df.apply(np.mean,axis=1)
print (df2)
print('-'*100)
df3=df.apply(lambda x: x.max() - x.min())
print("df3=df.apply(lambda x: x.max() - x.min()):")
print (df3)
print('-'*100)
df4=df['col1'].map(lambda x:x*100)
print("df4=df['col1'].map(lambda x:x*100):")
print (df4)
print('-'*100)
df5=df.applymap(lambda x:x*100)
print("df5=df.applymap(lambda x:x*100):")
print (df5) D:\Download\python3\python3.exe D:/Download/pycharmworkspace/s.py
col1 col2 col3
0 0.735342 0.438729 -0.261747
1 -1.490907 0.397943 0.105613
2 -0.298617 -0.328284 0.599502
3 -0.842654 0.324976 -0.047985
4 0.452950 1.102824 0.023971
----------------------------------------------------------------------------------------------------
df1=df.apply(np.mean)=df.apply(np.mean,axis=0) 默认按列执行操作:
col1 -0.288777
col2 0.387238
col3 0.083871
dtype: float64
----------------------------------------------------------------------------------------------------
df2=df.apply(np.mean,axis=1) 按行执行操作:
0 0.304108
1 -0.329117
2 -0.009133
3 -0.188555
4 0.526582
dtype: float64
----------------------------------------------------------------------------------------------------
df3=df.apply(lambda x: x.max() - x.min()):
col1 2.226249
col2 1.431108
col3 0.861248
dtype: float64
----------------------------------------------------------------------------------------------------
df4=df['col1'].map(lambda x:x*100):
0 73.534186
1 -149.090744
2 -29.861721
3 -84.265380
4 45.295040
Name: col1, dtype: float64
----------------------------------------------------------------------------------------------------
df5=df.applymap(lambda x:x*100):
col1 col2 col3
0 73.534186 43.872940 -26.174660
1 -149.090744 39.794331 10.561263
2 -29.861721 -32.828359 59.950153
3 -84.265380 32.497553 -4.798542
4 45.295040 110.282391 2.397062 Process finished with exit code 0
pandas函数应用的更多相关文章
- py使用笔记-pandas函数
1,nan替换为0df = df(np.nan, 0, regex=True)2.inf替换为0df= df(np.inf, 0.0, regex=True)3.从数据库读取数据到dataframei ...
- 从Excel到Python:最常用的36个Pandas函数
本文涉及pandas最常用的36个函数,通过这些函数介绍如何完成数据生成和导入.数据清洗.预处理,以及最常见的数据分类,数据筛选,分类汇总,透视等最常见的操作. 生成数据表 常见的生成数据表的方法有两 ...
- pandas函数高级
一.处理丢失数据 有两种丢失数据: None np.nan(NaN) 1. None None是Python自带的,其类型为python object.因此,None不能参与到任何计算中. #查看No ...
- pandas函数的使用
一.Pandas的数据结构 1.Series Series是一种类似与一维数组的对象,由下面两个部分组成: values:一组数据(ndarray类型) index:相关的数据索引标签 1)Serie ...
- Python:pandas(二)——pandas函数
Python:pandas(一) 这一章翻译总结自:pandas官方文档--General functions 空值:pd.NaT.np.nan //判断是否为空 if a is np.nan: .. ...
- pandas函数get_dummies的坑
转载:https://blog.csdn.net/mvpboss1004/article/details/79188190 pandas中的get_dummies得到的one-hot编码数据类型是ui ...
- 第六节:pandas函数应用
1.pipe() :表格函数应用: 2.apply():表格行列函数应用: 3.applymap():表格元素应用.
- 【转】python 中NumPy和Pandas工具包中的函数使用笔记(方便自己查找)
二.常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数据进行快速运算的标准 ...
- pandas(二)函数应用和映射
NumPy的ufuncs也可以操作pandas对象 >>> frame one two three four a 0 1 2 3 b 4 5 6 7 c 8 9 10 11 d 12 ...
随机推荐
- Appium——处理混合APP中H5的操作
https://blog.csdn.net/iiyting/article/details/51887488
- GitLab CI with docker and dind "mount: permission denied (are you root?)"
今天配置gitlab-runner时候出现以上错误,在官网中找到答案 https://gitlab.com/gitlab-org/gitlab-runner/issues/1544
- 分布式缓存技术redis系列(四)——redis高级应用(集群搭建、集群分区原理、集群操作)
本文是redis学习系列的第四篇,前面我们学习了redis的数据结构和一些高级特性,点击下面链接可回看 <详细讲解redis数据结构(内存模型)以及常用命令> <redis高级应用( ...
- ls操作总结
la = ls -a ll = ls -l ls -lsh: ls -lsh train_log 看train_log的软链接的原始路径
- 【转】图像的上采样(upsampling)与下采样(subsampled)
转自:https://blog.csdn.net/stf1065716904/article/details/78450997 参考: http://blog.csdn.net/majinlei121 ...
- 国产的骄傲,Deepin发布v15.9
深度操作系统是一个致力于为全球用户提供美观易用.安全可靠的Linux发行版.深度操作系统基于Linux内核,以桌面应用为主的开源GNU/Linux操作系统,支持笔记本.台式机和一体机.深度操作系统(d ...
- Android学习之AndroidStudio新建工程报Open File报错处理
在AndroidStudio中新建一个工程,报如下错误: 错误处理: 1.找到build.grandle(Module:app) 2.打开build.gradle(Module:app)文件如下图所示 ...
- 如何扩展32位EXE程序的使用内存
1 运行Visual studio的命令行,执行下面命令:editbin /LARGEADDRESSAWARE “C:\Program Files\Skyline\TerraExplorer Pro\ ...
- 1-添加自己的Lua执行函数(ESP8266-SDK开发(lua版本))
基础 lua_pushnumber (L, 1); lua_pushnumber (L,3); lua_pushnumber (L,4); return 3; c_sprintf(temp, &quo ...
- Literal 字面值 字面量 的理解
Literal 字面值 字面量 Literal, 在程序语言中,指表示某种数据值的符码.如,123 是整数值符码, 3.14 是浮点值符码,abcd 是字串值符码,True, False, 是逻辑值符 ...