本文整理几种基本容器:列表、元组、字典和集合的用法和collections中几种已经预先实现的容器数据结构:namedtuple(),双向链表deque,ChainMap,Counter,OrderedDict,defaultdict。其中,deque是一个双向链表的结构,namedtuple是tuple的拓展,ChainMap,Counter,OrderedDict,defaultdict都可以视作是字典的拓展。

  1. 基本顺序存储结构——列表与元组

Python中的基本顺序存储结构是列表与元组,在操作的复杂度上和数组完全相同,其中列表是可变数据类型,元组是不可变数据类型。这里先介绍一下两种数据结构共有的方法:

x in s

返回布尔值,x在s中

x not in s

返回布尔值,x不在s中为True

s + t

s和t的拼接,可以+=

s * n or n * s

n为int类型,返回s重复n次的结果。可以*=,同上

s[i]

返回索引为i的元素

s[i:j(:k)]

切片,返回子数组,从s[i]~s[i-1],k为步长,默认为1.

len(s)

现有元素个数

min(s)

最小元素

max(s)

最大元素

s.index(x[,i[,j]])

在s[i] ~ s[j-1]中,第一个大小为x的元素的索引,i,j默认0,-1

s.count(x)

统计x的数目

 

这些都不涉及对数组内元素的更改,因此是列表和元组都可以使用的。注意元组只能使用以上的方法。

接下来介绍可变有序容器的方法,注意各种方法都有利用切片赋值的实现!

s[i] = x

赋值操作

s[i:j(:k)] = t

按照切片规则选择元素进行赋值,注意如果t为[]可以用作删除,如果i==j可以用作插入

del s[i:j(:k)]

按照切片规则进行删除

s.append(x)

在尾部插入,等价于s.insert(I,len(s)),复杂度O(1).

s.clear()

清空所有元素 (等价于del s[:])

s.copy()

创建一份s的浅拷贝 (等价于 s[:])

s.extend(t) or s += t

在后面插入一组,相当于+=;

s.insert(i, x)

在i处插入x (等价于s[i:i] = [x])

s.pop([i])

默认删除尾部元素,否则删除i处的元素

s.remove(x)

删除第一个等于x的元素

s.reverse()

列表反向

此外,列表还独有s.sort(key=Nonereverse=None),其中key是一个函数名,也就是比较函数,reverse为布尔值,True的话则会列表反向。

Sort单独列出来是因为如果自己从可变有序容器里面派生的话并没有这个方法。

  1. 基本哈希存储结构——字典

字典是基于哈希表的一种映射结构,注意本文中介绍的Python的数据结构并没有任何一种使用了红黑树的搜索结构。

len(d)

返回字典元素个数

d[key]

返回key对应的value

d[key] = value

为字典元素赋值,如果没有则增加元素

del d[key]    

删除字典元素

key in d/ key not in d

查看key是否在d中

iter(d)

返回一个迭代器,具有__next__()方法

clear()

清空

copy()

浅复制

fromkeys(seq[, value])

以seq作为键,value作为值建立字典,默认value为None

get(key[, default])

安全的get方法,如果不存在返回default,如果不指定default则报错

items()

列出一个键值对的view

keys()

列出key的view,通常用于遍历

values()

Return a new view of the dictionary's values.

pop(key[, default])

Key在d中则删除,和del[key]一样,default如果被指定,那么当不存在key的时候会返回default而不会报错

popitem()

弹出一个键值对,为key的哈希序列中的第一个

setdefault(key[, default])

安全的添加操作,如果存在就返回value不更改值,如果不存在添加一个key:default的表项,default默认为0

update([other])

更改操作,other可以是键值对的列表或元组(二级的),也可以是字典,用other中的键值对添加到或替换原有键值对

  1. 键值相等的字典——集合set与frozenset

Python中由set和frozenset两种集合结构。由于set中的元素既是键又是值,所以他的内容必须是不可修改的,frozenset就是被声明为常量的set,,用于建立集合的集合

首先介绍两种集合共有的方法:

注意用的都是逻辑运算符进行衍生而不是+

len(s)

集合元素个数

x in/not in s

是否在集合中

isdisjoint(other)

和other的交集为空

set <= other

包含于

set < other

真包含于

set >= other

包含

set > other

真包含

set | other | ...

set & other & ...

set - other - ...

set ^ other

对称差(并-交)

copy()

浅拷贝

 

而set独有的方法是,一个是诸如&=之类的运算符,还有:

add(elem)

增加元素

remove(elem)

删除元素,不存在则报错

discard(elem)

删除元素,不存在不报错

pop()

删除哈希表第一个元素,空集报错

clear()

清空

 

  1. Tuple的拓展的生成器collections.namedtuple(typenamefield_namesverbose=Falserename=False)

这是一个生成器,本身并不是类。它生成的就是有名字的元组类型,很适合于存储表条目,例如下面的代码:

Point = namedtuple('Point', ['x', 'y'])

这样做,Point会定义一个具有x和y成员的类,想要调用相应对象的x属性,既可以使用p[0],也可以使用p.x。注意虽然叫namedtuple,但是其本身是可以更改的,可以视作是一种简单的结构体的定义方式。可以使用p=Point(1,2)进行定义

如果verbose为真,那么会将定义过程显示的输出到控制台;如果rename为真,属性中不符合命名规则的属性会被自动更名为'_index',如一些保留字或者数字开头。

利用这种有名字的生成器,可以使程序更加简洁,并且更加易读,用它作为value再来建字典就非常的方便了。

有几个内建方法,比如:

_make(iterable):使用一个可迭代的对象建立namedtuple,例如列表。

_asdict():转化为一个字典(Py3.1后为OrderedDict)

利用字符串格式的属性名找出值getattr(p,'x');

dict转化为Tuple要利用Unpacking语法 **args,即Point(**somedict),**语法会把dict切分开,注意此语法只发生在参数传递过程中才是有效的。

一个*是把容器中的元素一个一个传递,两个*是专门用于解包字典,键值对应使用。

还有内置属性可以以字符串的形式输出参数的名字 ._fields

  1. 字典组ChainMap

定义时候,后边按元组的形式接受参数ChainMap(*map),每一个参数都应该是一个字典名,最后返回一个字典组。

建立之后,其中有maps属性,是所有的字典组成的列表;parents属性,是除了第一个字典之外的所有字典的列表。

内建的new_child(m=None)方法,是添加一个新的字典到列表中作为第一个字典,等价于ChainMap(m,*d.maps).

字典组拥有字典的各种操作,它的特点是所有涉及到更新的操作如插入删除等都是只针对第一个字典,而查找的操作则是按照顺序对全部字典进行查找。如果希望更新操作也是对全部字典,则可以使用它进行派生,并且对maps使用for循环。

  1. 计数器Counter(本质是C++multiset、sql bag)

可以认为他是一个key-int字典,不过他实际上是一个multiset!,int默认为0,有几个创建方法:

从一般可迭代对象c = Counter('gallahad'),从字典c = Counter({'red': 4, 'blue': 2}),直接指明(字典也可以这样初始化,是底层方法)c = Counter(cats=4, dogs=8) 。

它具有字典的全部操作,同时又添加了一下计数器的很自然的操作。

.elements():列表形式一个一个列出元素。

.most_common([n]):列出出现次数最多的前n个元素的列表,如果n没有,则按顺序列出所有的。

.subtrackc(other):两个计数器相减,可以出现0或负数。可以用+c 这一语句清除0和负数

四种运算:+,-,&,|,按key的加减,按multiset取交和并,注意出现的负数和0会被清楚

  1. 特殊字典OrderedDict和defaultdict

这两个都具有普通字典的全部功能,不过有一些不同:

  1. defaultdict(class)

指定了值的类型,会用这种类型自动构造,相当于可以提前使用这种类的方法,一个有趣的例子是:

>>> s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]

>>> d = defaultdict(set)

>>> for k, v in s:

...     d[k].add(v)

...

>>> sorted(d.items())

[('blue', {2, 4}), ('red', {1, 3})]

  1. class collections.OrderedDict([items])

这种容器不光存储了键值对,还维护了被加入字典的顺序,使它能够像栈一样弹出,增加了两个方法:

.popitem(last = True):    移除最后一个加入的键值对,如果last=false则移除第一个加入的键值对。

.move_to_end(key,last = True):    将某一个键的条目作为最后一个加入的(false->作为最先加入的)

这个数据类型可以简单地实现LRU的算法,可以通过一个key:(value,forekey,nextkey)的字典结构实现此类。

  1. 双向链表deque

class collections.deque([iterable[, maxlen]])

就是简单意义上的双向链表(双向队列),注意这里不再支持切片操作了,随机访问的操作保留,可以通过随机访问通过del实现删除,但是没有切片无法用于替换,截取等操作,无法sort:

append(x)¶

右侧插入

appendleft(x)

左侧插入

clear()

清空

copy()

浅复制

count(x)

计数

extend(iterable)

按组右侧连接

extendleft(iterable)

按组左侧连接

index(x[, start[, stop]])

搜索等于x的第一个位置

insert(i, x)

在i处插入x

pop()

右侧删除

popleft()

左侧删除

remove(value)

搜索第一个元素并删除

reverse()

队列反向

rotate(n)

前n个队列的尾部元素移动到首部

maxlen

有界情况下返回最大长度

注意其没有截取,切片等操作,只能通过copy,pop的方式实现截取操作。

Python 容器用法整理的更多相关文章

  1. Python高级用法总结

    Python很棒,它有很多高级用法值得细细思索,学习使用.本文将根据日常使用,总结介绍Python的一组高级特性,包括:列表推导式.迭代器和生成器.装饰器. 列表推导(list comprehensi ...

  2. Python面试题整理-更新中

    几个链接: 编程零基础应当如何开始学习 Python ? - 路人甲的回答 网易云课堂上有哪些值得推荐的 Python 教程? - 路人甲的回答 怎么用最短时间高效而踏实地学习 Python? - 路 ...

  3. 转 Python常见数据结构整理

    http://www.cnblogs.com/jeffwongishandsome/archive/2012/08/05/2623660.html Python常见数据结构整理 Python中常见的数 ...

  4. python学习笔记整理——字典

    python学习笔记整理 数据结构--字典 无序的 {键:值} 对集合 用于查询的方法 len(d) Return the number of items in the dictionary d. 返 ...

  5. !!对python列表学习整理列表及数组详细介绍

    1.Python的数组分三种类型:(详细见 http://blog.sina.com.cn/s/blog_6b783cbd0100q2ba.html) (1) list 普通的链表,初始化后可以通过特 ...

  6. Spring JdbcTemplate用法整理

    Spring JdbcTemplate用法整理: xml: <?xml version="1.0" encoding="UTF-8"?> <b ...

  7. python 常用库整理

    python 常用库整理 GUI 图形界面 Tkinter: Tkinter wxPython:wxPython pyGTK:PyGTK pyQt:pyQt WEB框架 django:django w ...

  8. python argparse用法总结

    转:python argparse用法总结 1. argparse介绍 argparse是python的一个命令行解析包,非常适合用来编写可读性非常好的程序. 2. 基本用法 prog.py是我在li ...

  9. linq用法整理

    linq用法整理 普通查询 var highScores = from student in students where student.ExamScores[exam] > score se ...

随机推荐

  1. MYSQL安装报错需要.NET4.0

    MySQL安装,提示需要.NET4.0 解决:下载安装.NET4.0即可 链接:https://pan.baidu.com/s/1u0e0lafBbR0QYEcXFsv9sQ 提取码:q6rr 复制这 ...

  2. Python正则表达式【转载】

    原作者:LouieZhang 原文出处:https://www.cnblogs.com/LouieZhang/p/7399836.html 0x00 简介 正则表达式就是描述字符串排列的一套规则.利用 ...

  3. python 的小技巧之统计list里面元素的个数

    一般写法 def count_list(std:list,tongji): i=0 for item in std: if item==tongji: i+=1 print(i) if __name_ ...

  4. kafka集群搭建(图文并用)

    将安装包上传服务器并解压 scp kafka_2.11-1.0.0.tgz username@{ip}:~/. mkdir /usr/local/kafka mv kafka_2.11-1.0.0.t ...

  5. ubuntu之路——day10.6 如何理解人类表现和超过人类表现

    从某种角度来说,已知的人类最佳表现其实可以被当做贝叶斯最优错误,对于医学图像分类可以参见下图中的例子. 那么如何理解超过人类表现,在哪些领域机器已经做到了超越人类呢?

  6. Python flask模块接口开发学习总结

    引言 Flask 是一个简单且十分强大的Python web 框架.它被称为微框架,“微”并不是意味着把整个Web应用放入到一个Python文件,微框架中的“微”是指Flask旨在保持代码简洁且易于扩 ...

  7. Hive的配置详解和日常维护

    Hive的配置详解和日常维护 一.Hive的参数配置详解 1>.mapred.reduce.tasks  默认为-1.指定Hive作业的reduce task个数,如果保留默认值,则Hive 自 ...

  8. 001 安装mysql

    在安装docker之后,安装一个mysql的容器试试手.可以参考违章: URL: https://www.cnblogs.com/limingxie/p/8655457.html

  9. [转]浅谈HTTP中GET、POST用法以及它们的区别

    HTTP定义了与服务器交互的不同方法,最基本的方法有4种,分别是GET,POST,PUT,DELETE.URL全称是资源描述符.我们可以这样认为: 一个URL地址,它用于描述一个网络上的资源,而HTT ...

  10. jenkins用户和权限管理

    添加用户 进入管理界面,选择manage users,添加用户 将人和角色绑定 用户和项目绑定 角色管理 可以针对不同的站点对不同的人赋权 添加角色并赋权 将角色赋权给对应的用户 使用新添加的这个用户 ...