Panda的学习之路（3）——pandas 设置特定的值&处理没有数据的部分

先设定好我们的dataframe：

# pandas 设置特定的值

dates=pd.date_range('',periods=6)

# print(dates)

df=pd.DataFrame(np.arange(24).reshape(6,4),index=dates,columns=['a','b','c','d'])

print(df)

结果：

             a   b   c   d

2013-01-01   0   1   2   3

2013-01-02   4   5   6   7

2013-01-03   8   9  10  11

2013-01-04  12  13  14  15

2013-01-05  16  17  18  19

2013-01-06  20  21  22  23

一、修改特定的数据

1.1分别根据索引和行（列）号来修改特定的值

df.iloc[2,2]=1111 #第二列第二行的数据 改为1111

print(df)

df.loc['','b']=2222

print(df)

结果：

             a     b     c   d

2013-01-01   0  2222     2   3

2013-01-02   4     5     6   7

2013-01-03   8     9  1111  11

2013-01-04  12    13    14  15

2013-01-05  16    17    18  19

2013-01-06  20    21    22  23

1.2对特定的行进行筛选操作

df[df.a>4]=0 #这个是指 a这一列 只要是大于4的 其所在的行全部变为0

print(df)

结果：

            a  b  c  d

2013-01-01  0  1  2  3

2013-01-02  4  5  6  7

2013-01-03  0  0  0  0

2013-01-04  0  0  0  0

2013-01-05  0  0  0  0

2013-01-06  0  0  0  0

1.3对特定的列进行筛选操作：

df.a[df.a>4]=0#这个是只更改某一列

print(df)

结果

            a   b   c   d

2013-01-01  0   1   2   3

2013-01-02  4   5   6   7

2013-01-03  0   9  10  11

2013-01-04  0  13  14  15

2013-01-05  0  17  18  19

2013-01-06  0  21  22  23

二、增加一个列

#datafame 加一个空的行

df['f']=np.nan

print(df)

#这个是增加一个有内容的行

df['e']=pd.Series([1,2,3,4,5,6],index=pd.date_range('',periods=6))

print(df)

结果：

             a   b   c   d   f  e

2013-01-01   0   1   2   3 NaN  1

2013-01-02   4   5   6   7 NaN  2

2013-01-03   8   9  10  11 NaN  3

2013-01-04  12  13  14  15 NaN  4

2013-01-05  16  17  18  19 NaN  5

2013-01-06  20  21  22  23 NaN  6

三、处理没有数据的部分

3.1设定丢失数据

# pandas处理没有数据的部分

dates=pd.date_range('',periods=6)

# print(dates)

df=pd.DataFrame(np.arange(24).reshape(6,4),index=dates,columns=['a','b','c','d'])

print(df)

df.iloc[0,1]=np.nan#设定丢失的数据

df.iloc[1,2]=np.nan

print(df)

结果：

             a     b     c   d

2013-01-01   0   NaN   2.0   3

2013-01-02   4   5.0   NaN   7

2013-01-03   8   9.0  10.0  11

2013-01-04  12  13.0  14.0  15

2013-01-05  16  17.0  18.0  19

2013-01-06  20  21.0  22.0  23

3.2丢弃操作

丢弃特定的行

df=df.dropna(axis=0,how='any')#axis=0 表示行 how={'any','all'}

print(df)

结果

             a     b     c   d

2013-01-03   8   9.0  10.0  11

2013-01-04  12  13.0  14.0  15

2013-01-05  16  17.0  18.0  19

2013-01-06  20  21.0  22.0  23

丢弃特定的列：

df=df.dropna(axis=1,how='any')

print(df)

结果

             a   d

2013-01-01   0   3

2013-01-02   4   7

2013-01-03   8  11

2013-01-04  12  15

2013-01-05  16  19

2013-01-06  20  23

填充操作：

# 填充操作

df=df.fillna(value=2333)

print(df)

结果：

             a       b       c   d

2013-01-01   0  2333.0     2.0   3

2013-01-02   4     5.0  2333.0   7

2013-01-03   8     9.0    10.0  11

2013-01-04  12    13.0    14.0  15

2013-01-05  16    17.0    18.0  19

2013-01-06  20    21.0    22.0  23

四、判断是否有缺失

# 判断是否有缺失

df=df.isnull()

print(df)

a=np.any(df.isnull()==True)

print(a)

结果：

                a      b      c      d

2013-01-01  False   True  False  False

2013-01-02  False  False   True  False

2013-01-03  False  False  False  False

2013-01-04  False  False  False  False

2013-01-05  False  False  False  False

2013-01-06  False  False  False  False

直接确定是否有缺失的

True

Panda的学习之路（3）——pandas 设置特定的值&处理没有数据的部分的更多相关文章

Qt 学习之路 2（57）：可视化显示数据库数据
Qt 学习之路 2(57):可视化显示数据库数据(skip) 豆子 2013年6月26日 Qt 学习之路 2 26条评论前面我们用了两个章节介绍了 Qt 提供的两种操作数据库的方法.显然,使用QSq ...
大数据学习之路又之从小白到用sqoop导出数据
写这篇文章的目的是总结自己学习大数据的经验,以为自己走了很多弯路,从迷茫到清晰,真的花费了很多时间,希望这篇文章能帮助到后面学习的人. 一.配置思路安装linux虚拟机--->创建三台虚拟机- ...
Mysql数据表字段设置了默认值，插入数据后默认字段的值却为null，不是默认值
我将mysql的数据表的某个字段设置了默认值为1,当向该表插入数据的时候该字段的值不是默认值,而是null. 我的错误原因: 对数据库的操作我使用了持久化工具mybatis,插入数据的时候插入的是整个 ...
Panda的学习之路（2）——pandas选择数据
首先定义panda dates=pd.date_range(',periods=6) # print(dates) df=pd.DataFrame(np.arange(24).reshape(6,4) ...
Panda的学习之路（1）——series 和 Dataframe
一.Series panda最基本的对象 # pandas的基础s=pd.Series([1,3,6,np.nan,44,1])#建立个简单的基本对象类似一个一位数组print("建立个简 ...
Android学习之路——Android四大组件之activity（二）数据的传递
上一篇讲了activity的创建和启动,这一篇,我们来讲讲activity的数据传递 activity之间的数据传递,这里主要介绍的是activity之间简单数据的传递,直接用bundle传递基本数据 ...
Spark学习之路（九）SparkCore的调优之数据倾斜调优
摘抄自:https://tech.meituan.com/spark-tuning-pro.html 数据倾斜调优调优概述有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Sp ...
Spark学习之路（九）SparkCore的调优之数据倾斜调优[转]
调优概述有的时候,我们可能会遇到大数据计算中一个最棘手的问题--数据倾斜,此时Spark作业的性能会比期望差很多.数据倾斜调优,就是使用各种技术方案解决不同类型的数据倾斜问题,以保证Spark作业的 ...
IOS开发---菜鸟学习之路--（十三）-利用MBProgressHUD进行异步获取数据
本章将介绍如何利用MBProgressHUD实现异步处理数据. 其实我本来只是像实现一个加载数据时提示框的效果,然后问了学长知道了这个类,然后就使用了接着就发现了一个“BUG” 再然后就发现原来MB ...

随机推荐

selenium统计网页加载时间
参考网址: https://blog.csdn.net/thlzjfefe/article/details/99712974 https://blog.csdn.net/weixin_43664254 ...
xss和sql注入学习1
在本地搭建一个存在漏洞的网站,验证xss漏洞和SQL注入的利用方法. 使用phpStudy工具搭建一个美食CMS网站平台. 0x01 xss测试打开调试模式,定位姓名栏输入框: 尝试在value中 ...
pycharm运行RF脚本时的环境搭建与配置
1.安装pycharm:2.file->setting,下载插件intellibot,重启pycharm:3.配置识别RF类型文件,filefile->editor->file ty ...
jQuery实现隔行变色、悬停变色（ CSS3伪类选择器：nth-child() ）
<title>实现隔行变色</title> <script src="Js/jquery-1.8.0.min.js" type="text/ ...
手机内存卡RAW无法格式化的解决办法
突然出现这个问题,这是麻烦: 网上找了各种办法:什么软件修复,disk等修复,创建新磁盘,新扇到,win自动修复啊:开始----运行框中输入 :convert X: /fs:FAT(X为电脑 ...
HTML代码中<%%>、<%=%>
运行.获取后台代码或值.<%%>之间可以写服务器端代码,比如<%for(var i=0;i<10;i++){//执行循环体}%>又如<%for(var i=0;i& ...
PP: UMAP: uniform manifold approximation and projection for dimension reduction
From Tutte institute for mathematics and computing Problem: dimension reduction Theoretical foundati ...
linux安装Zookeeper及redis集群
亲测有效: 1.linux下安装zookeeper:https://www.cnblogs.com/zuolun2017/p/8186254.html 2.linux下安装redis集群:https: ...
参考 ZTree 加载大数据量。加载慢问题解析
参考 ZTree 加载大数据量. 1.一次性加载大数据量加载说明 1).zTree v3.x 针对大数据量一次性加载进行了更深入的优化,实现了延迟加载功能,即不展开的节点不创建子节点的 DOM. 2) ...
CF432D Prefixes and Suffixes
CF432D Prefixes and Suffixes 题意给你一个长度为n的长字符串,"完美子串"既是它的前缀也是它的后缀,求"完美子串"的个数且统计这些 ...

Panda的学习之路（3）——pandas 设置特定的值&处理没有数据的部分

Panda的学习之路（3）——pandas 设置特定的值&处理没有数据的部分的更多相关文章

随机推荐

热门专题