Python中str、list、numpy分片操作
在Python里,像字符串(str)、列表(list)、元组(tupple)和这类序列类型都支持切片操作
对对象切片,s是一个字符串,可以通过类似数组索引的方式获取字符串中的字符,同时也可以用s[a:b:c]的形式对s在a和b之间,以c为间隔取值,c的值还可以为负,负值则意味着反向取值
>>> s = 'bicycle'
>>> s[0]
'b'
>>> s[1]
'i'
>>> s[::3]
'bye'
>>> s[::-1]
'elcycib'
>>> s[::-2]
'eccb'
给切片赋值
首先,生成一个长度为16,从0到15的列表
>>> l = list(range(16))
>>> l
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]
用[20,30]将取代索引[2,5)的值
>>> l[2:5] = [20, 30]
>>> l
[0, 1, 20, 30, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]
索引[5,8)将被删除
>>> del l[5:8]
>>> l
[0, 1, 20, 30, 5, 9, 10, 11, 12, 13, 14, 15]
从数组第9个索引开始,以两个单位为间隔,将[11,22]赋值给左边的分片对象,如果赋值数组中元素的个数和分片对象中元素的个数不同,则会报错
>>> l[9::2]
[13, 15]
>>> l[9::2] = [11, 22]
>>> l
[0, 1, 20, 30, 5, 9, 10, 11, 12, 11, 14, 22]
>>> l[6::2]
[10, 12, 14]
>>> l[6::2] = [66, 77, 88] # 同理,l[6::2]必须为[n1,n2,n3]的数组,如果不是则将其 赋值为[66, 77, 88]则会报错
>>> l
[0, 1, 20, 30, 5, 9, 66, 11, 77, 11, 88, 22]
列表l[2:5]的结果是[20, 30, 5],而我们的赋值是[30, 33],所以30会代替20,33会代替30,而5则会被去除。如果左边数组元素的个数少于赋值数组中元素的个数,则原数组分片之后的元素会排在新元素之后
>>> l[2:5]
[20, 30, 5]
>>> l[2:5] = [30, 33]
>>> l
[0, 1, 30, 33, 9, 66, 11, 77, 11, 88, 22]
>>> l[2:5]
[30, 33, 9]
>>> l[2:5] = [-10, -20, -30, -40, -50]
>>> l
[0, 1, -10, -20, -30, -40, -50, 66, 11, 77, 11, 88, 22]
拷贝一个分片对象,并修改其中的值,并不会修改原列表对象中的值
>>> l1 = l[2:5]
>>> l1
[-10, -20, -30]
>>> l1 = [10, 20, 30]
>>> l1
[10, 20, 30]
>>> l
[0, 1, -10, -20, -30, -40, -50, 66, 11, 77, 11, 88, 22]
如果将一个数字赋值给左边的分片对象,则会报错
>>> l[2:5] = 10
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: can only assign an iterable
numpy基本的索引和切片
>>> import numpy as np
>>> arr = np.arange(10)
>>> arr
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> arr[5]
5
>>> arr[5:8]
array([5, 6, 7])
>>> arr[5:8] = 12 # 这里不会像之前会报错
>>> arr
array([ 0, 1, 2, 3, 4, 12, 12, 12, 8, 9])
如上所示,当你将一个标量赋值给一个切片对象时(如arr[5:8] = 12),该值会自动传播到整个选区。跟之前列表的分片的区别在于,numpy数组分片是原始数组的视图,数据没有被复制,视图上任何的修改都会直接反映到源数据上,如果不希望修改到源数据,则用arr[5:8].copy():
>>> arr_slice = arr[5:8]
>>> arr_slice
array([12, 12, 12])
>>> arr_slice[1] = 99
>>> arr_slice
array([12, 99, 12])
>>> arr
array([ 0, 1, 2, 3, 4, 12, 99, 12, 8, 9])
>>> arr_slice[:] = 66
>>> arr
array([ 0, 1, 2, 3, 4, 66, 66, 66, 8, 9])
>>> arr_slice_copy = arr[5:8].copy()
>>> arr_slice_copy
array([66, 66, 66])
>>> arr_slice_copy[:] = 88
>>> arr_slice_copy
array([88, 88, 88])
>>> arr
array([ 0, 1, 2, 3, 4, 66, 66, 66, 8, 9])
在一个二维数组中,各索引位置上的元素不再是标量而是一维数组:
>>> arr2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
>>> arr2d[2]
array([7, 8, 9])
>>> arr2d[0][2]
3
>>> arr2d[0, 2]
3
按照行或者列来进行分片
>>> arr2d
array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
>>> arr2d[:2] # 取前两行,即第0行和第1行
array([[1, 2, 3],
[4, 5, 6]])
>>> arr2d[:2, 1:] # 取前两行的第零列之后所有元素
array([[2, 3],
[5, 6]])
>>> arr2d[:, 1:2] # 取所有行的第一列元素(列索引从0开始)
array([[2],
[5],
[8]])
>>> arr2d[1, :2] # 取第一行的前两列的元素元素
array([4, 5])
>>> arr2d[2, :1] # 取第二行的第零列元素
array([7])
>>> arr2d[:, :1] # 取所有行的第零列元素
array([[1],
[4],
[7]])
>>> arr2d[:, 1:] = 0 # 同样,分片表达式的赋值操作也会扩散到源数据
>>> arr2d
array([[1, 0, 0],
[4, 0, 0],
[7, 0, 0]])
布尔型索引
假设我们有一个用于存储数据的数组以及一个存储姓名的数组(含有重复项)。
>>> import numpy as np
>>> from numpy.random import randint
>>> names = np.array(['Bob', 'Joe', 'Bob', 'Will', 'Will', 'Joe', 'Joe', 'Bob'])
>>> data = randint(6, size=(8, 4))
>>> data
array([[2, 1, 2, 2],
[3, 3, 4, 2],
[0, 5, 3, 5],
[2, 1, 5, 2],
[1, 3, 0, 3],
[0, 0, 0, 1],
[0, 0, 0, 5],
[4, 2, 5, 1]])
假设每个名字都对应data数组中的一行,而我们想要选出对应于名字“Bob”的所有行。我们可以这样操作
>>> names == 'Bob'
array([ True, False, True, False, False, False, False, True], dtype=bool)
>>> data[names == 'Bob']
array([[2, 1, 2, 2],
[0, 5, 3, 5],
[4, 2, 5, 1]])
布尔型数组的长度必须跟被索引的数组长度一致,此外,还可以将布尔型数组跟分片、整数(或整数序列)混合使用
>>> data[names == 'Bob', 2:]
array([[2, 2],
[3, 5],
[5, 1]])
>>> data[names == 'Bob', 3]
array([2, 5, 1])
>>> data[names == 'Bob', 3:]
array([[2],
[5],
[1]])
如果需要选取多个名字组合需要组合多个布尔条件,使用&(和)、|(或)之类的布尔算术运算符即可:
>>> mask = (names == 'Bob') | (names == 'Will')
>>> mask
array([ True, False, True, True, True, False, False, True], dtype=bool)
>>> data[mask]
array([[2, 1, 2, 2],
[0, 5, 3, 5],
[2, 1, 5, 2],
[1, 3, 0, 3],
[4, 2, 5, 1]])
注意:Python关键字and和or在布尔型数据中无效
通过布尔型数组设置值是一种经常用到的手段,为了将data中所有的偶数设置为3,我们只需:
>>> data
array([[2, 1, 2, 2],
[3, 3, 4, 2],
[0, 5, 3, 5],
[2, 1, 5, 2],
[1, 3, 0, 3],
[0, 0, 0, 1],
[0, 0, 0, 5],
[4, 2, 5, 1]])
>>> data[data % 2 == 0] = 3
>>> data
array([[3, 1, 3, 3],
[3, 3, 3, 3],
[3, 5, 3, 5],
[3, 1, 5, 3],
[1, 3, 3, 3],
[3, 3, 3, 1],
[3, 3, 3, 5],
[3, 3, 5, 1]])
花式索引
花式索引是numpy术语,它指的是利用整数数组进行索引。假设我们有一个8×4数组:
>>> arr = np.empty((8, 4))
>>> for i in range(8):
... arr[i] = i
...
>>> arr
array([[ 0., 0., 0., 0.],
[ 1., 1., 1., 1.],
[ 2., 2., 2., 2.],
[ 3., 3., 3., 3.],
[ 4., 4., 4., 4.],
[ 5., 5., 5., 5.],
[ 6., 6., 6., 6.],
[ 7., 7., 7., 7.]])
>>> arr[[3, 5, 0, 6]]
array([[ 3., 3., 3., 3.],
[ 5., 5., 5., 5.],
[ 0., 0., 0., 0.],
[ 6., 6., 6., 6.]])
>>> arr[[3, -3, -1]]
array([[ 3., 3., 3., 3.],
[ 5., 5., 5., 5.],
[ 7., 7., 7., 7.]])
arr[[3, 5, 0, 6]]会索引源数组的第三行、第五行、第零行、第六行,然后组成新的视图返回,而arr[[3, -3, -1]]则会索引第三行、倒数第三行和倒数第一行
我们生成了一个8×4数组,然后传入两个索引数组[1, 5, 7, 2]、 [0, 3, 1, 2],然后我们得到一个一维的数组
>>> arr = np.arange(32).reshape((8, 4))
>>> arr
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11],
[12, 13, 14, 15],
[16, 17, 18, 19],
[20, 21, 22, 23],
[24, 25, 26, 27],
[28, 29, 30, 31]])
>>> arr[[1, 5, 7, 2], [0, 3, 1, 2]]
array([ 4, 23, 29, 10])
下面我们分析一下上面的代码究竟发生了什么,第一个索引数组[1, 5, 7, 2],我们获取第一行、第五行、第七行和第二行,然后我们将根据第二个索引数组 [0, 3, 1, 2],获取第一行的第零列、第五行的三列……以此类推,最后,我们获得了一个一维的数组
当然,在有些情况下,我们希望按照不同的顺序获取源数组不同的行,并且还要在获取后,改动原来的列顺序,于是我们可以这样做:
>>> arr[[1, 5, 7, 2]]
array([[ 4, 5, 6, 7],
[20, 21, 22, 23],
[28, 29, 30, 31],
[ 8, 9, 10, 11]])
>>> arr[[1, 5, 7, 2]][:, [2, 1, 3, 0]]
array([[ 6, 5, 7, 4],
[22, 21, 23, 20],
[30, 29, 31, 28],
[10, 9, 11, 8]])
>>> arr[np.ix_([1, 5, 7, 2], [2, 1, 3, 0])]
array([[ 6, 5, 7, 4],
[22, 21, 23, 20],
[30, 29, 31, 28],
[10, 9, 11, 8]])
如上,我们既可以用arr[[1, 5, 7, 2]][:, [2, 1, 3, 0]]这样的方式获取获取不同的行,再改变其中的列顺序,同时也可以用np.ix_函数达到一样的目的,不过需要注意的一点是,花式索引跟分片不一样,它总是将数据复制到新的数组中:
>>> arr1 = arr[np.ix_([1, 5, 7, 2], [2, 1, 3, 0])]
>>> arr1
array([[ 6, 5, 7, 4],
[22, 21, 23, 20],
[30, 29, 31, 28],
[10, 9, 11, 8]])
>>> arr1[1] = 66
>>> arr1
array([[ 6, 5, 7, 4],
[66, 66, 66, 66],
[30, 29, 31, 28],
[10, 9, 11, 8]])
>>> arr
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11],
[12, 13, 14, 15],
[16, 17, 18, 19],
[20, 21, 22, 23],
[24, 25, 26, 27],
[28, 29, 30, 31]])
Python中str、list、numpy分片操作的更多相关文章
- Python中的文件和目录操作实现
Python中的文件和目录操作实现 对于文件和目录的处理,虽然可以通过操作系统命令来完成,但是Python语言为了便于开发人员以编程的方式处理相关工作,提供了许多处理文件和目录的内置函数.重要的是,这 ...
- Python中str()与repr()函数的区别——repr() 的输出追求明确性,除了对象内容,还需要展示出对象的数据类型信息,适合开发和调试阶段使用
Python中str()与repr()函数的区别 from:https://www.jianshu.com/p/2a41315ca47e 在 Python 中要将某一类型的变量或者常量转换为字符串对象 ...
- Python中关于csv的简单操作
Python中关于csv的简单操作 CSV操作简单,直接import csv即可, 主要使用reader和pandas 1 reader的简单使用 csv.reader("1.csv&quo ...
- Python中json的简单读写操作
Python中json的简单读写操作 JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式.它基于ECMAScript的一个子集. JSON采用完全独立于语言的 ...
- python中str常用操作
1. 字符串的操作 字符串的连接操作 符号: + 格式:str1 + str2 例如:str1 = 'I Love' str2 = 'You!' print(str1 + str2) >> ...
- Python 中的类的相关操作
构造函数 构造函数是任何类都有的特殊方法.当要创建一个类时,就要调用构造函数.他的名字是__init__.init的前后分别是两个下划线.时间类Time的构造函数如下: >>> cl ...
- Python中字符串有哪些常用操作?纯干货超详细
- 【Python从入门到精通】(九)Python中字符串的各种骚操作你已经烂熟于心了么?
您好,我是码农飞哥,感谢您阅读本文,欢迎一键三连哦. 本文将重点介绍Python字符串的各种常用方法,字符串是实际开发中经常用到的,所有熟练的掌握它的各种用法显得尤为重要. 干货满满,建议收藏,欢迎大 ...
- Python中str字符串的功能介绍
Str字符串的功能介绍 1. 字符串的操作 字符串的连接操作 符号: + 格式:str1 + str2 例如:str1 = 'I Love' str2 = 'You!' print(str1 + st ...
- Python中str()与repr()函数的区别
在 Python 中要将某一类型的变量或者常量转换为字符串对象通常有两种方法,即str()或者 repr() . >>> a = 10 >>> type(str(a ...
随机推荐
- 爱加密so保护简单脱壳测试
1. 最近研究so文件的保护,在网上搜索发现爱加密支持对so文件的保护,然后联系客户,本来是想让客户保护一个自己的so文件来做测试的,结果客户各种不愿意,说要签什么XX协议后才能给so保护,各种蛋 ...
- uLua学习之使用协程(终)
前言 今天是本系列的第六篇文章,也是最后一篇,我们来看看uLua中如何来实现协程吧.首先,让我们明确协程的概念.在百度百科上的是这样说的,协程更适合于用来实现彼此熟悉的程序组件,如合作式多任务,迭代器 ...
- 解决windows7系统的快捷方式无法添加到任务栏
#以下4条,进入cmd命令界面下逐个执行cmd /k reg add "HKEY_CLASSES_ROOT\lnkfile" /v IsShortcut /fcmd /k reg ...
- dsniff
/usr/local/sbin/dsniff 这个东西好强大,获取到用户名和密码 bt服务区器上:dsniff -i eth0 -m(自动协议检测) 在另外一个电脑上打开网页,登陆ftp服务器,回头看 ...
- JQUERY操作JSON数组添加新的属性和值
语法: var data = {}; data["Order"] =order; data["Sort"] = sort; 但是需要注意的是,如果data后面还 ...
- window下安装ubuntu(ubuntu可删除)
进入ububtu13.04的安装界面,这里我们选择了“中文(简体)”,然后单击安装: 下图是现场拍的: 出现如下图时,请根据需要选择,然后单击“继续” , 接下来会出现问你是否要连接网络,我们选择 ...
- Oracle小技巧_不同表空间不同用户导入导出数据dmp
[博主注:数据库方面 ITPUB网站及博客内容非常丰富] 转载来源ITPUB 博客 经常有人会问:原来的数据在USERS表空间里面,我想把它IMP进APP表空间,我已经修改了目的用户的默认表空间, ...
- Servlet 学习小结
一.是什么 是用java编写的服务器端程序.从狭义来讲,servlet是java语言实现的一个接口:广义的servlet是指任何实现了这个servlet接口的类.一般情况下,人们将servlet理解为 ...
- github相关问题
一.项目编译打包后生成的dist文件夹后:项目提交到github上dist文件提交不上去. 在.gitignore文件,删除一行 二.更改github的语言属性 .gitattributes文件:若项 ...
- swiper动画效果
参考swiper官方网站:http://www.swiper.com.cn/ Swiper常用于移动端网站的内容触摸滑动: 结构展示: 纯javascript打造的滑动特效插件,面向手机.平板电脑 ...