2018.03.27 pandas duplicated 和 replace 使用

 #.duplicated / .replace

 import numpy as np

 import pandas as pd

 s = pd.Series([1,1,1,1,1,2,3,3,3,4,4,5,6,6])

 print(s)

 print(s.duplicated())#True表示重复 得到布尔型

 print(s[s.duplicated() == False])#

 #通过布尔类型的判断来得到不重复的值

 s_re = s.drop_duplicates()#直接去除重复值

 #inplace=True 表示直接修改原来的值

 print(s_re)

 print('------')

 #DataFrame测试

 df = pd.DataFrame({'key1':['a','a',3,4,5],

                    'key2':['a','a','b','b','c']})

 print(df)

 print('---------------------')

 print(df.duplicated())

 print('---------------------')

 print(df.drop_duplicates())

结果：

0     1

1     1

2     1

3     1

4     1

5     2

6     3

7     3

8     3

9     4

10    4

11    5

12    6

13    6

dtype: int64

0     False

1      True

2      True

3      True

4      True

5     False

6     False

7      True

8      True

9     False

10     True

11    False

12    False

13     True

dtype: bool

0     1

5     2

6     3

9     4

11    5

12    6

dtype: int64

0     1

5     2

6     3

9     4

11    5

12    6

dtype: int64

------

  key1 key2

0    a    a

1    a    a

2    3    b

3    4    b

4    5    c

---------------------

0    False

1     True

2    False

3    False

4    False

dtype: bool

---------------------

  key1 key2

0    a    a

2    3    b

3    4    b

4    5    c

 #.replace()

 s = pd.Series(list('aaabbbcdd'))

 print(s)

 print(s.replace('a',np.nan))

 print(s.replace(['a','d'],np.nan))

 print(s.replace({'a':'Hello','d':'World'}))

结果：

0    a

1    a

2    a

3    b

4    b

5    b

6    c

7    d

8    d

dtype: object

0    NaN

1    NaN

2    NaN

3      b

4      b

5      b

6      c

7      d

8      d

dtype: object

0    NaN

1    NaN

2    NaN

3      b

4      b

5      b

6      c

7    NaN

8    NaN

dtype: object

0    Hello

1    Hello

2    Hello

3        b

4        b

5        b

6        c

7    World

8    World

dtype: object

2018.03.27 pandas duplicated 和 replace 使用的更多相关文章

2018.03.27 pandas concat 和 combin_first使用
# 连接和修补concat.combine_first 沿轴的堆叠连接 # 连接concatimport pandas as pdimport numpy as np s1 = pd.Series([ ...
【VSCode】Windows下VSCode编译调试c/c++【更新 2018.03.27】
--------– 2018.03.27 更新--------- 便携版已更新,点此获取便携版已知BUG:中文目录无法正常调试用于cpptools 0.15.0插件的配置文件更新新的launch ...
2018.03.27 python pandas merge join 使用
#2.16 合并 merge-join import numpy as np import pandas as pd df1 = pd.DataFrame({'key1':['k0','k1','k2 ...
2018/03/27 每日一个Linux命令之 cron
Cron 用于配置定时任务. -- 环境为 Ubuntu16-04 -- 先说说怎么配置一个简单的定时任务.直观的可以看到效果. 之前在网上查找资料,对Shell编程不熟悉的实在是很头疼,走了不少弯路 ...
网易2018.03.27算法岗，三道编程题100%样例AC题解
博主欢迎转载,但请给出本文链接,我尊重你,你尊重我,谢谢~http://www.cnblogs.com/chenxiwenruo/p/8660814.html特别不喜欢那些随便转载别人的原创文章又不给 ...
数据分析03 /基于pandas的数据清洗、级联、合并
数据分析03 /基于pandas的数据清洗.级联.合并目录数据分析03 /基于pandas的数据清洗.级联.合并 1. 处理丢失的数据 2. pandas处理空值操作 3. 数据清洗案例 4. 处 ...
20172319 2018.03.27-04.05 《Java程序设计》第4周学习总结
20172319 2018.03.27-04.05 <Java程序设计>第4周学习总结教材学习内容总结第四章编写类类与对象的回顾:对象是有状态的,状态由对象的属性值确定.属性由类中 ...
Pandas: 使用str.replace() 进行文本清洗
str.replace()可以一次处理一整个Series.str.replace()的正式形式为 Series.str.replace(pat, repl) ,其中pat为想要寻找的模式,一般为正则表 ...
2018/03/31 每日一个Linux命令之 date
date 命令主要用于查看和修改时间和时区 -- 这里主要学习基本的查看和设置时间和时区的方法. 直接显示日期 date '+%D' 效果 vagrant@hong:~$ date '+%D' 03/ ...

随机推荐

java.lang.ClassNotFoundException: org.apache.jsp.login_jsp
<span style="font-family: Simsun; background-color: rgb(255, 255, 255);">想必大家在用Eclip ...
2019-2020-1 20199319《Linux内核原理与分析》第三周作业
操作系统是如何工作的基础知识 1.计算机的三个法宝:存储程序计算机.函数调用堆栈机制.中断. 2.堆栈的具体作用:记录函数调用框架.传输函数参数.保存返回值的地址.提供函数内部局部变量的存储空间. ...
samba服务及vsftpd服务
如何配置多个网卡第一步: 打开设置,选择网络驱动器添加第二步: ip a 查看网卡是否添加成功第三步: 打开刚添加的网卡配置文件(注意,你刚添加的网卡是没有配置文件的,需要去复制一份到/etc/ ...
parted分区的步骤
使用parted分区的步骤1. fdisk -l ##查看一下当前的存储设备,这里可以看到新加入的磁盘,比如/dev/sdb2. parted /dev/sdb ...
vue2.0 笔记（杂记）
一.vue class.style表达式的类型: 字符串.对象和数组1.字符串 <div class="static" v-bind:class="class-a& ...
Mac 升级python2.7 到 3.5
Mac 系统 OSX 10.12 以上第1步:下载Python3.5 下载地址如下: Python3.5 第二步:安装python 3.50 点击下载好的pkg文件进行安装,安装完成之后,pyt ...
STM32Cube IDE配置串口发送与接收
此项目源码下载地址:https://github.com/lizhiqiang0204/STM32CubeIDE_Uart 串口与中断配置如下在生成的main函数中,添加开启串口接收中断 HAL_I ...
CodeForces-585B(BFS)
链接: https://vjudge.net/problem/CodeForces-585B 题意: The mobile application store has a new game calle ...
Mac OS找不到/usr/include文件夹的解决办法
Mojave最新解决方案:终端执行: xcode-select --install #完成后执行 sudo installer -pkg /Library/Developer/CommandLineT ...
Hibernate方法save、update、merge、saveOrUpdate及get和load的区别
在看这几个方法区别之前,有必要了解hibernate实体对象的三种状态,点击查看 http://www.cnblogs.com/Y-S-X/p/8345754.html 一.update 和 merg ...

2018.03.27 pandas duplicated 和 replace 使用

2018.03.27 pandas duplicated 和 replace 使用的更多相关文章

随机推荐

热门专题