pandas函数应用
1、管道函数
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2018/5/24 15:03
# @Author : zhang chao
# @File : s.py #pipe管道函数的应用
import pandas as pd
import numpy as np def adder(ele1,ele2):
return ele1+ele2 df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])
print(df)
df2=df.pipe(adder,2)#df中每一个元素都加2
print('-'*100)
print("df.pipe(adder,2) df中每一个元素都加2")
print (df2) D:\Download\python3\python3.exe D:/Download/pycharmworkspace/s.py
col1 col2 col3
0 -0.541685 -1.009440 -1.680244
1 -0.881437 0.022469 0.911686
2 0.930035 1.073783 0.096894
3 -1.282204 -0.039941 0.147482
4 -1.743847 -1.187832 -0.402219
----------------------------------------------------------------------------------------------------
df.pipe(adder,2) df中每一个元素都加2
col1 col2 col3
0 1.458315 0.990560 0.319756
1 1.118563 2.022469 2.911686
2 2.930035 3.073783 2.096894
3 0.717796 1.960059 2.147482
4 0.256153 0.812168 1.597781 Process finished with exit code 0
2、
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2018/5/24 15:03
# @Author : zhang chao
# @File : s.py #可以使用apply()方法沿DataFrame或Panel的轴应用任意函数,它与描述性统计方法一样,采用可选的轴参数。
# 默认情况下,操作按列执行,将每列列为数组。
import pandas as pd
import numpy as np df = pd.DataFrame(np.random.randn(5,3),columns=['col1','col2','col3'])
print (df)
print('-'*100)
print("df1=df.apply(np.mean)=df.apply(np.mean,axis=0) 默认按列执行操作:")
df1=df.apply(np.mean)
print (df1)
print('-'*100)
print("df2=df.apply(np.mean,axis=1) 按行执行操作:")
df2=df.apply(np.mean,axis=1)
print (df2)
print('-'*100)
df3=df.apply(lambda x: x.max() - x.min())
print("df3=df.apply(lambda x: x.max() - x.min()):")
print (df3)
print('-'*100)
df4=df['col1'].map(lambda x:x*100)
print("df4=df['col1'].map(lambda x:x*100):")
print (df4)
print('-'*100)
df5=df.applymap(lambda x:x*100)
print("df5=df.applymap(lambda x:x*100):")
print (df5) D:\Download\python3\python3.exe D:/Download/pycharmworkspace/s.py
col1 col2 col3
0 0.735342 0.438729 -0.261747
1 -1.490907 0.397943 0.105613
2 -0.298617 -0.328284 0.599502
3 -0.842654 0.324976 -0.047985
4 0.452950 1.102824 0.023971
----------------------------------------------------------------------------------------------------
df1=df.apply(np.mean)=df.apply(np.mean,axis=0) 默认按列执行操作:
col1 -0.288777
col2 0.387238
col3 0.083871
dtype: float64
----------------------------------------------------------------------------------------------------
df2=df.apply(np.mean,axis=1) 按行执行操作:
0 0.304108
1 -0.329117
2 -0.009133
3 -0.188555
4 0.526582
dtype: float64
----------------------------------------------------------------------------------------------------
df3=df.apply(lambda x: x.max() - x.min()):
col1 2.226249
col2 1.431108
col3 0.861248
dtype: float64
----------------------------------------------------------------------------------------------------
df4=df['col1'].map(lambda x:x*100):
0 73.534186
1 -149.090744
2 -29.861721
3 -84.265380
4 45.295040
Name: col1, dtype: float64
----------------------------------------------------------------------------------------------------
df5=df.applymap(lambda x:x*100):
col1 col2 col3
0 73.534186 43.872940 -26.174660
1 -149.090744 39.794331 10.561263
2 -29.861721 -32.828359 59.950153
3 -84.265380 32.497553 -4.798542
4 45.295040 110.282391 2.397062 Process finished with exit code 0
pandas函数应用的更多相关文章
- py使用笔记-pandas函数
1,nan替换为0df = df(np.nan, 0, regex=True)2.inf替换为0df= df(np.inf, 0.0, regex=True)3.从数据库读取数据到dataframei ...
- 从Excel到Python:最常用的36个Pandas函数
本文涉及pandas最常用的36个函数,通过这些函数介绍如何完成数据生成和导入.数据清洗.预处理,以及最常见的数据分类,数据筛选,分类汇总,透视等最常见的操作. 生成数据表 常见的生成数据表的方法有两 ...
- pandas函数高级
一.处理丢失数据 有两种丢失数据: None np.nan(NaN) 1. None None是Python自带的,其类型为python object.因此,None不能参与到任何计算中. #查看No ...
- pandas函数的使用
一.Pandas的数据结构 1.Series Series是一种类似与一维数组的对象,由下面两个部分组成: values:一组数据(ndarray类型) index:相关的数据索引标签 1)Serie ...
- Python:pandas(二)——pandas函数
Python:pandas(一) 这一章翻译总结自:pandas官方文档--General functions 空值:pd.NaT.np.nan //判断是否为空 if a is np.nan: .. ...
- pandas函数get_dummies的坑
转载:https://blog.csdn.net/mvpboss1004/article/details/79188190 pandas中的get_dummies得到的one-hot编码数据类型是ui ...
- 第六节:pandas函数应用
1.pipe() :表格函数应用: 2.apply():表格行列函数应用: 3.applymap():表格元素应用.
- 【转】python 中NumPy和Pandas工具包中的函数使用笔记(方便自己查找)
二.常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数据进行快速运算的标准 ...
- pandas(二)函数应用和映射
NumPy的ufuncs也可以操作pandas对象 >>> frame one two three four a 0 1 2 3 b 4 5 6 7 c 8 9 10 11 d 12 ...
随机推荐
- jQuery:自定义函数
<!doctype html><html><head><meta charset="utf-8"><title>< ...
- yarn出现“There are no scenarios ; must have at least one"
错误信息:“There are no scenarios ; must have at least one" 背景:在将vscode自动化构建编译打包时出现这种情况,主要是执行yarn这一步 ...
- Linux上VsCode编译打包运行
前提:最好使用root用户可以排除一些不必要的错误. 一. 准备环境 Node.js(>= 8.12.0, < 9.0.0) Python2.7 Yarn(可以通过npm install ...
- strlen的容易tle情况
for(int i=1;i<=strlen(**);i++ 这很容易tle 因为 strlen很大 int m=strlen(**)
- vue 如何在循环中 "监听" 的绑定v-model数据
vue 如何在循环中 "监听" 的绑定v-model数据 阅读目录 vue 如何在循环中 "监听" 的绑定v-model数据 1. 普通属性的值进行监听 2. ...
- PAT A1145 Hashing - Average Search Time (25 分)——hash 散列的平方探查法
The task of this problem is simple: insert a sequence of distinct positive integers into a hash tabl ...
- centos7搭建elasticsearch
Elasticsearch:负责日志检索和分析,它的特点有:分布式,零配置,自动发现,索引自动分片,索引副本机制,restful风格接口,多数据源,自动搜索负载等 Logstash:对日志进行收集.过 ...
- scrapy实验1 爬取中国人寿官网新闻,保存为xml
一.scrapy 实验 爬中国人寿新闻,保存为xml 如需转发,请注明出处:小婷儿的python https://www.cnblogs.com/xxtalhr/p/10517297.html 链 ...
- linux问题总结
编写后台进程的管理脚本,使用service deamon-name stop的时候,出现如下提示:/sbin/service: line 66: 23299 Terminated env -i LAN ...
- Luogu3527 POI2011 Meteors 整体二分、树状数组、差分
传送门 比较板子的整体二分题目,时限有点紧注意常数 整体二分的过程中将时间在\([l,mid]\)之间的流星使用树状数组+差分进行维护,然后对所有国家查看一遍并分好类,递归下去,记得消除答案在\([m ...