字典对象的 Pythonic 用法（上篇：转载）

　　转载：https://mp.weixin.qq.com/s?timestamp=1498528588&src=3&ver=1&signature=DfFeOFPXy44ObCMO3yMBLLgt5iFzbFAuShvog4m*JYf1w-gLIDZd7VoPWJN5f36DbVcaBJi33DkfXw6i-h*F7t0-D5-AJsAX*NeUCQAvfR4AYY6g5HMEUFyKFH31O65ulsSDpRyQf4roj-ZQnOZhPBol9POO67N9YO4x29OvrzY=

　　字典对象在Python中作为最常用的数据结构之一，和数字、字符串、列表、元组并列为5大基本数据结构，字典中的元素通过键来存取，而非像列表一样通过偏移存取。笔者总结了字典的一些常用Pyhonic用法，这是字典的Pythonic用法的上篇

1、使用 in/not in 检查 key 是否存在于字典

　　判断某个 key 是否存在于字典中时，一般初学者想到的方法是，先以列表的形式把字典所有键返回，再判断该key是否存在于键列表中：

dictionary = {}

keys = dictionary.keys()

for k in keys:

if key == k:

print True

break

　　更具Pythonic的用法是使用in关键字来判断 key 是否存在于字典中：

if key in dictionary:

print True

else:

print False

　　2、使用 setdefault() 初始化字典键值

　　使用字典的时候经常会遇到这样一种应用场景：动态更新字典，像如下代码，如果 key 不在 dictionary 中那么就添加它并把它对应的值初始为空列表 [] ，然后把元素 append 到空列表中：

dictionary = {}

if "key" not in dictionary:

dictionary["key"] = []

dictionary["key"].append("list_item")

　　尽管这段代码没有任何逻辑错误，但是我们可以使用setdefault来实现更Pyhonic的写法：

dictionary = {}

dictionary.setdefault("key", []).append("list_item")

　　字典调用 setdefault 方法时，首先检查 key 是否存在，如果存在该方法什么也不做，如果不存在 setdefault 就会创建该 key，并把第二个参数[]作为 key 对应的值。

　　3、使用 defaultdict() 初始化字典

　　初始化一个字典时，如果初始情况下希望所有 key 对应的值都是某个默认的初始值，比如有一批用户的信用积分都初始为100，现在想给 a 用户增加10分

d = {}

if 'a' not in d:

d['a'] = 100

d['a'] += 10

　　同样这段代码也没任何问题，换成更pyhtonic的写法是：

from collections import defaultdict

d = defaultdict(lambda: 100)

d['a'] += 10

　　defaultdict 是位于 collections 模块下，它是 dict 类的子类，语法结构是：

class collections.defaultdict([default_factory[, ...]])

　　第一个参数default_factory是一个工厂方法，每次初始化某个键的时候将会被调用，value就是default_factory返回的值，剩下的参数和dict()函数接收的参数一样

　　4、使用 iteritems() 迭代大数据

　　迭代大数据字典时，如果是使用 items() 方法，那么在迭代之前，迭代器迭代前需要把数据完整地加载到内存，这种方式不仅处理非常慢而且浪费内存，下面代码约占1.6G内存（为什么是1.6G?可以参考：

　　http://stackoverflow.com/questions/4279358/pythons-underlying-hash-data-structure-for-dictionaries）

d = {i: i * 2 for i in xrange(10000000)}

for key, value in d.items():

print("{0} = {1}".format(key, value))

　　而使用 iteritem() 方法替换 items() ，最终实现的效果一样，但是消耗的内存降低50%，为什么差距那么大呢？因为 items() 返回的是一个 list，list 在迭代的时候会预先把所有的元素加载到内存，而 iteritem() 返回的一个迭代器(iterators)，迭代器在迭代的时候，迭代元素逐个的生成。

d = {i: i * 2 for i in xrange(10000000)}

for key, value in d.iteritem():

print("{0} = {1}".format(key, value))

　　5、高效合并字典

　　普通方法

　　合并多个字典的时候可以用一行代码实现：

x = {'a': 1, 'b': 2}

y = {'b': 3, 'c': 4}

z = dict(x.items() + y.items())

　　这种写法看起来很Pythonic，但仔细分析的话，它的执行效率并不高，items()方法在python2.7中返回的是列表对象，两个列表相加得到一个新的列表，这样内存中存在3个列表对象，如果两个列表的大小都是1G，那么执行这段代码需要占用4G的空间来创建这个字典。此外这段代码在Python3中会报错，因为python3中items()返回的是dict_items对象，而不是列表。

>>> c = dict(a.items() + b.items())

Traceback (most recent call last):

File "<stdin>", line 1, in <module>

TypeError: unsupported operand type(s) for +: 'dict_items' and 'dict_items'

　　在python3中，你需要明确地强制转换成list对象：

z = dict(list(x.items()) + list(y.items()))

　　Pythonic方法

　　在Python3.5中提供了一种全新的Pythonic方法：

z = {**x, **y}

　　不过考虑到大部分系统还是基于Python2，所以一种更兼容的pythonic方法是：

z = x.copy()

z.update(y)

　　当然，你可以把它封装成一个函数：

def merge_dicts(*dict_args):

'''

可以接收1个或多个字典参数

'''

result = {}

for dictionary in dict_args:

result.update(dictionary)

return result

z = merge_dicts(a, b, c, d, e, f, g)

　　其他方法

　　还有其他方式来合并字典，但是性能不一定是最优的，比如： python2.7可以支持字典推导式

{k: v for d in dicts for k, v in d.items()}

　　python2.6及以下版本使用

{k: v for d in dicts for k, v in d.items()}

　　性能对比

import timeit

>>> min(timeit.repeat(lambda: {**x, **y})) # python3.5

0.4094954460160807

>>> min(timeit.repeat(lambda: merge_two_dicts(x, y)))

0.5726828575134277

>>> min(timeit.repeat(lambda: {k: v for d in (x, y) for k, v in d.items()} ))

1.163769006729126

>>> min(timeit.repeat(lambda: dict((k, v) for d in (x, y) for k, v in d.items())))

2.2345519065856934

　　直接使用python3.5中的{**x, **y}是最快的，使用update次之，用字典推导式相对来说是最慢的。

字典对象的 Pythonic 用法（上篇：转载）的更多相关文章

字典对象的 Pythonic 用法（上篇）
字典对象在Python中作为最常用的数据结构之一,和数字.字符串.列表.元组并列为5大基本数据结构,字典中的元素通过键来存取,而非像列表一样通过偏移存取.笔者总结了字典的一些常用Pyhonic用法,这 ...
Python成长之路第二篇（3）_字典的置函数用法
字典的置函数用法(字典dict字典中的key不可以重复) class dict(object): """ dict() -> new empty dictionar ...
Objective-c 字典对象
oc 中的 NSDictionary 的作用同 java 中的字典类相同,提供了 “键-值”对的组合.比如,是用字典类实现对学生姓名和学号的存放,编号是一个键(唯一性),姓名是值.它的方法有: 下面通 ...
深入理解JavaScript系列（47）：对象创建模式（上篇）
介绍本篇主要是介绍创建对象方面的模式,利用各种技巧可以极大地避免了错误或者可以编写出非常精简的代码. 模式1:命名空间(namespace) 命名空间可以减少全局命名所需的数量,避免命名冲突或过度. ...
Python中super的用法【转载】
Python中super的用法[转载] 转载dxk_093812 最后发布于2019-02-17 20:12:18 阅读数 1143 收藏展开转载自 Python面向对象中super用法与MRO ...
VBS使用Scripting.Dictionary字典对象
Scripting.Dictionary是个很有用的组件,其创建了类似于Key索引对应Value值的字典对象,并且在其内部提供了快速索引访问的机制,可以让我们通过Key直接索引到指定的Value,比遍 ...
python 基础学习（字典对象，set对象）
1.dict 字典对象 a.定义对象 d={'a':14,'b':12}b.通过key获取value d['a'] 方法1.判断key是否存在 if 'a' in d: d['a']方法2:通过用ge ...
JavaScript中创建字典对象（dictionary）实例
这篇文章主要介绍了JavaScript中创建字典对象(dictionary)实例,本文直接给出了实现的源码,并给出了使用示例,需要的朋友可以参考下对于JavaScript来说,其自身的Array对象 ...
DOM Style样式对象的详细用法
DOM Style样式对象的详细用法 HTML Style样式比较复杂,相应访问.修改方法也有所差异.参考相关资料,整理如下. 典型Html文件如下,有三种定义方式. <head> ...

随机推荐

无线路由器中WMM/Short GI/AP隔离各是什么功能, 开启时PC无法ping通手机.
无线路由器的WMM功能和开启ap隔离,以及开启ShortGI有什么用无线路由器中有开启WMM.开启Short GI和开启AP隔离分别代表什么呢?这是我在我的TP-LINK无线路由器TL-WR84 ...
Linux 邮件服务器之跟我一步一步来实现一个邮件系统【转】
转自:http://tchuairen.blog.51cto.com/3848118/1686875/ 原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处 .作者信息和本声明.否则将追究法 ...
AWS Ubuntu部署EMQTT的小坑
Redis身份认证中的 is_superuser 表示不查检用户密码和ACL规则如果是Ubuntu,集群设置节点名须改为:ubuntu@私有Ip,安全组最好相互开放所有端口如果使用了ELB,EMQ ...
《Java编程思想》笔记第九章接口
1.抽象类和抽象方法抽象方法,仅有方法声明没有方法体 abstract class AbstractClass{ abstract void f(); //没有 {} } 只要有一个或者多个抽象方法 ...
Android 判断SD卡是否存在和使用容量查询
1.判断SD卡是否存在返回true表示存在 /* 判断SD卡是否存在返回true表示存在 */ public boolean avaiableMedia() { String status = E ...
Mathematica作图
第2讲在Mathematica中作图一个较强的符号计算系统均有很好的绘图功能,Mathematica也不例外,Mathematica 拥有非常强大的绘图功能.并且提供了一大批基本数学函数的图 ...
求第N个回文数模板
备忘. /*看到n可以取到2*10^9.说明普通方法一个个暴力计算肯定会超时的,那打表呢?打表我们要先写个打表的代码,这里不提供.打完表观察数据,我们会发现数据其实是有规律的.完全不需要暴力的把所有数 ...
HDU 变形课 1181【DFS/BFS】
变形课 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 131072/65536 K (Java/Others) Total Submissi ...
SPFA解决单源最短路径
SPFA(Shortest Path Faster Algorithm): 一:基本算法在求解单源最短路径的时候,最经典的是 Dijkstra 算法,但是这个算法对于含有负权的图就无能为力了,而 B ...
HDU 3507 Print Article（斜率优化推导）
$dp$,斜率优化. 第一次做斜率优化的题目,看了一些题解,自己总结一下. 这题是说有$n$个数字,可以切成任意段,每一段的费用是这一段数字的和平方加上$M$.问最小费用是多少. 设$dp[i]$为$ ...

字典对象的 Pythonic 用法（上篇：转载）

字典对象的 Pythonic 用法（上篇：转载）的更多相关文章

随机推荐

热门专题