每日一“酷”之heapq
作用:heapq模块实现一个适用于Python列表的最小堆排序算法
堆(heap)是一个属性数据结构,其中子节点与父节点是一种有序关系。二叉堆是一种特殊的堆,二叉堆是完全二元树(二叉树)或者是近似完全二元树(二叉树)。可以使用以下如下方式组织的列表或数表示,即元素N的子元素位于2*N+1和2*N+2。这种布局允许原地重新组织堆,从而不必再增加或删除元素时分配大量内存。
最大堆确保父节点大于或等于其两个子节点。最小堆要求父节点小雨或等于其子节点。Python的heqpq模块实现了一个最小堆。
1、示例数据
数据存储在:heapq_heapdata.py中
data = [19,9,4,10,11]
堆的输出存储在heapq_showtree.py
import math
import cStringIO def show_tree(tree,total_width=36,fill=' '):
output = cStringIO.StringIO()
last_row = -1
for i,n in enumerate(tree):
if i :
row = int(math.floor(math.log(i+1,2)))
else:
row = 0
if row != last_row:
output.write('\n')
columns = 2 ** row
col_width = int(math.floor((total_width * 1.0) / columns))
output.write(str(n).center(col_width,fill))
last_row = row
print output.getvalue()
print '-' * total_width
return
2、创建堆
创建堆的两种基本方式:heappush()和heapify()
import heapq
from heapq_heapdata import data
from heapq_showtree import show_tree heap = []
print 'random : ' , data
for n in data:
print 'add %3d:' % n
heapq.heappush(heap,n)
show_tree(heap)
运行结果:

使用heappush()时,从数据源增加新元素时会保持元素的堆顺序
如果数据已经存在内存中,使用heaoify()原地重新组合字列表中的元素会更高效
import heapq
from heapq_heapdata import data
from heapq_showtree import show_tree heap = []
print 'random : ' , data
heapq.heapify(data)
print 'heapifed : '
show_tree(data)
运行结果:

如果按堆顺序一次一个元素构建列表,其结果与构建一个无序列表在调用heapify()是一样的。
3、访问堆内容
一旦堆已正确组织,就可以使用heappop()删除有最小值的元素
import heapq
from heapq_heapdata import data
from heapq_showtree import show_tree print 'random :', data
heapq.heapify(data)
print 'heapifed : '
show_tree(data)
for i in xrange(2):
smallest = heapq.heappop(data)
print 'pop %3d:' % smallest
show_tree(data)
运行结果:

这个例子是由stdlib文档改写的,其中使用了heapify()和heappop()对一个数组列表排序。
如果希望在一个操作中删除现有元素并替换新值,可以使用heapreplace()。
import heapq
from heapq_heapdata import data
from heapq_showtree import show_tree heapq.heapify(data)
print 'start:'
show_tree(data)
for n in [0,13]:
smallest = heapq.heapreplace(data, n)
print 'replace %2d with %3d' % (smallest,n)
show_tree(data)
运行结果:

通过原地替换元素,这样可以维持一个固定大小的堆,如按优先级排序的作业队列。
4、堆的数据极值
Heapq还包括两个检查可迭代对象的函数,查找其中包含最大值或最小值的范围
import heapq
from heapq_heapdata import data
print 'all :',data
print '3 largest :',heapq.nlargest(3,data)
print 'from sort :',list(reversed(sorted(data)[-3:]))
print '3 smallest:',heapq.nsmallest(3,data)
print 'from sort :',sorted(data)[:3]
运行结果:

只有当n值(n>1)相对小时使用nlargest()和nsmallest()才算高效,不过有些情况下这两个函数会很方便。
每日一“酷”之heapq的更多相关文章
- 每日一“酷”之Cookie
Cookie---Http Cookie 作用:Cookie模块定义一些类来解析和创建HTTP cookie首部 Cookie模块为大多数符合RFC 2109的cookie实现一个解析器.这个实现没有 ...
- 每日一“酷”之Queue
Queue—线程安全的FIFO实现 作用:提供一个线程安全的FIFO实现 Queue模块提供了一个适用于多线程编程的先进先出(first-in,first-out)数据结构,可以用来在生产者和消费者线 ...
- 每日一“酷”之pprint
pprint – 美观打印 作用:美观打印数据结构 pprint 包含一个“美观打印机”,用于生成数据结构的一个美观视图.格式化工具会生成数据结构的一些表示,不仅可以由解释器正确地解析,而且便于人类阅 ...
- 每日一“酷”之copy
Copy – 复制对象 作用:提供一些函数,可以使用浅副本或深副本语义复制对象. copy模块包括两个函数copy()和deepcopy(),用于复制现有的对象 1. 浅副本 copy()创建的浅副 ...
- 每日一“酷”之bisect
作用:维护有序列表,而不必在每次想列表增加一个元素时调用sort排序 bisect 模块实现了一个算法用于向列表中插入元素,同时仍保持列表有序.有些情况下,这比反复对一个了表序列更高效,另外也比构建一 ...
- 每日一“酷”之array
array--国定类型数据序列 array模块定义一个序列数据结构,看起来和list非常相似,只不过所有成员都必须是相同的基本类型. 1.初始化 array实例化时可以提高一个参数来描述允许哪个种数据 ...
- 每日一“酷”之difflib
介绍:difflib 比较序列.该模块包含一些用来计算和处理序列直接差异的工具.她对于比较文本尤其用,其中包含的函数可以使用多种常用差异格式生成报告. 测试数据(splitlines()按行划分为序列 ...
- 每日一“酷”之textwrap
介绍:需要美观打印时,可以使用textwrap模块来格式化要输出的文本,这个模块允许通过编程提高类似段落自动换行或填充特性等功能. 1 创建实例数据 sample_text = ''' I’m ver ...
- 每日一“酷”之string
介绍:string模块可以追溯到最早的Python版本中.现在很多的被移植为str和unicode对象的方法,在python3.0中会被完全去除.string模块中,有很多有用的常量和累,用来处理st ...
随机推荐
- 沈逸老师PHP魔鬼特训笔记(8)
创建模板文件: 这节课老师带领我们开始创建TEMPLATE,按照老师教导的思路,我们希望这样一种代码写法:1.譬如我定义一个变量$name=‘’;2.然后呢我读取一个模板.3.再然后我在这个模板里 设 ...
- 【Shell脚本学习4】几种常见的Shell
上面提到过,Shell是一种脚本语言,那么,就必须有解释器来执行这些脚本. Unix/Linux上常见的Shell脚本解释器有bash.sh.csh.ksh等,习惯上把它们称作一种Shell.我们常说 ...
- iOS中的加密方式 与 文件解压缩
1.Base64加密方式 Base64是一种加密方法,可逆的加密. Base64中的可打印字符包括字母A-Z.a-z.数字0-9,这样共有62个字符./ + 填充 = echo -n BC|base6 ...
- Stream Collector
// Accumulate names into a List List<String> list = people.stream().map(Person::getName).colle ...
- 重构13-Extract Method Object(提取方法对象)
重构来自于Martin Fowler的重构目录.你可以在这里找到包含简介的原始文章. 在我看来,这是一个比较罕见的重构,但有时却终能派上用场.当你尝试进行提取方法的重构时,需要引入大量的方法.在一个 ...
- 关于如何用sql语句查询出连续的一串数字
在数据库操作中,经常有一些这样的操作:插入诺干条测试数据.查询这个月的登录情况(没有登录的日期不能不存在,要显示数量为0),获取诺干条guid. 这些的基础都是怎么生成连续的一串数字 1 2 3 ...
- noip2015day1 T1 4510 神奇的幻方
4510 神奇的幻方 noip2015day1 T1 时间限制: 1 s 空间限制: 128000 KB 题目等级 : 黄金 Gold 题解 查看运行结果 题目描述 Descripti ...
- table表格实现点击修改 PHP同步数据库 排序
最近几天在做一个网站,牵扯到一个导航管理的功能!领导说不用作,可是由于自己自作主张,搞了1天的功能.领导说这个导航管理就是不用做!容易牵扯出好多问题来!估摸是客户小的原因! 没办法就把我1天的劳动荒废 ...
- 【原创】CQ数据库损坏修复
上周三中午CQ数据库数据文件损坏,导致登录时一张关键的表无法查询报错从而cq无法登录,此次故障和上次的一样,不过恢复的非常曲折,导致停机两天,现简单的通报下恢复过程: 故障原因: oracle-902 ...
- iOS - 苹果健康架构 & 基于HealthKit的健康数据的编辑
最近公司需求,研究了一周之久的苹果健康架构,内容包括:资料调研.报告与HealthKit.framework - API,这一研习还在持续进行中.至此,主要认识到了2点:对苹果健康健康架构设计与实现原 ...