转载自: https://blog.csdn.net/y472360651/article/details/80725355

查找最大或最小的N个元素

怎么样从一个列表中取出最大或最小的N个元素的列表?在Python的标准库中,有一个名为heapq的,该模块中具有两个函数nlargestnsmallest可以完全解决我们的问题,下面我们来看看这两个函数的作用:

import heapq

L = [5, 4, 6, 2, 8, 10, 1]

# 获取列表中最大的三个元素
print heapq.nlargest(3, L)
# 获取列表中最小的三个元素
print heapq.nsmallest(3, L) # ===========打印结果如下===========
[10, 8, 6]
[1, 2, 4]
两个函数都可以传递参数,用于更复杂的数据结构当中:

import heapq

info_list = [
{"name": "laozhang", "age": 20, "score": 90},
{"name": "laoli", "age": 21, "score": 88},
{"name": "laowang", "age": 24, "score": 58},
{"name": "laohe", "age": 22, "score": 77},
{"name": "laoyang", "age": 21, "score": 89}
] # 取出年龄最大的两个数据
print heapq.nlargest(2, info_list, key=lambda item: item["age"]) # ===========打印结果如下===========
[{'name': 'laowang', 'age': 24, 'score': 58}, {'name': 'laohe', 'age': 22, 'score': 77}]

其实,在底层的实现中,heapq首先会将列表数据进行堆排序后放入一个列表:

import heapq

L = [5, 4, 6, 8, 2, 7]
# heapify操作之后,会将列表中最小的元素挪到第一位
heapq.heapify(L)
print L # [2, 4, 6, 8, 5, 7] print heapq.heappop(L) # 2
print heapq.heappop(L) # 4
print heapq.heappop(L) # 5

堆数据结构最重要的特征就是,列表的第一个元素永远是最小值。剩余的小值元素可以通过heapq.heappop(iterable)获得。该方法会先将第一个元素弹出来,然后下一个最小的元素来取代被弹出的元素,以此来获得列表L中最小的三个元素为2,4,5。

当查找的元素个数相对比较少时,nlargestnsmallest函数是很合适的。如果你仅仅想查找唯一一个最大的或最小的值时,那么minmax函数会更快一些。类似的,如果查找元素个数与列表的长度大小接近时,通常先排序这个列表,然后使用切片的方式会更加快一些,我们需要在正确的场合使用nlargestnsmallest函数才能发挥它们的优势。

实现一个优先级队列

怎么实现一个按优先级排序的队列?并且在这个队列上面每次执行pop操作总是返回优先级最高的那个元素。下面的类使用heaqp模块实现了一个简单的优先级队列:

import heapq

class HeapQueue(object):
def __init__(self):
self._queue = []
self._index = 0 def push(self, item, priority):
heapq.heappush(self._queue, (-priority, self._index, item))
self._index += 1 def pop(self):
return heapq.heappop(self._queue) class Item(object):
def __init__(self, name):
self.name = name def __repr__(self):
return "Item({!r})".format(self.name) q = HeapQueue()
q.push(Item("abc"), 5)
q.push(Item("def"), 1)
q.push(Item("ghi"), 2)
q.push(Item("jkl"), 1) print q._queue
print q.pop() print q._queue
print q.pop() print q._queue
print q.pop() print q._queue
print q.pop() # =============打印结果如下=============
[(-5, 0, Item('abc')), (-1, 1, Item('def')), (-2, 2, Item('ghi')), (-1, 3, Item('jkl'))]
(-5, 0, Item('abc')) [(-2, 2, Item('ghi')), (-1, 1, Item('def')), (-1, 3, Item('jkl'))]
(-2, 2, Item('ghi')) [(-1, 1, Item('def')), (-1, 3, Item('jkl'))]
(-1, 1, Item('def')) [(-1, 3, Item('jkl'))]
(-1, 3, Item('jkl'))

从打印结果观察可以得知,第一个pop()操作返回优先级最高的元素。另外注意到,有两个优先级一样的元素(defjkl),pop操作是按照它们的插入顺序返回的,先插入的先返回,后插入的后返回。

在上面代码中,队列包含了一个(-priority, self._index, item)元组,优先级为负数的目的是使得元素按照优先级从高到低进行排序,index变量确保同等优先级下,按照插入顺序先后取出,先插入的先取出,后插入的后取出。

首先阐明一点,对象的实例是不能进行排序的,所以我们必须引入一个元组,并对其设置优先级,只要对两个元素的优先级不同就能进行比较,如果两个优先级一样,就需要引入一个index变量,作为辅助排序。如果没有index作辅助排序,那么两个优先级相同的就不能进行比较,将会出错,请看下面错误比较:

a = (1, Item("abc"))
b = (1, Item("def"))
print a < b # 将会报如下错误:
TypeError: '<' not supported between instances of 'Item' and 'Item'

但是,如果我们引入一个变量index作辅助排序,就能进行比较:

a = (1, 3, Item("abc"))
b = (1, 1, Item("def"))
print(a < b) #===========打印结果如下===========
False

因为在本示例中,index变量不可能会出现相同的值,所以就可以很好的避免上面的错误。在Python做元组比较时,如果前面的比较可以确定了,后面的操作就不会发生了。

标准库heapq的使用的更多相关文章

  1. Python标准库模块之heapq – 堆构造

    Python标准库模块之heapq – 堆构造 读前福利:几百本经典书籍https://www.johngo689.com/2158/ 原文链接:https://www.johngo689.com/2 ...

  2. Python3标准库:heapq堆排序算法

    1. heapq堆排序算法 堆(heap)是一个树形数据结构,其中子节点与父节点有一种有序关系.二叉堆(binary heap)可以使用一个有组织的列表或数组表示,其中元素N的子元素位于2*N+1和2 ...

  3. python学习笔记系列----(八)python常用的标准库

    终于学到了python手册的最后一部分:常用标准库.这部分内容主要就是介绍了一些基础的常用的基础库,可以大概了解下,在以后真正使用的时候也能想起来再拿出来用. 8.1 操作系统接口模块:OS OS模块 ...

  4. 【循序渐进学Python】11.常用标准库

    安装完Python之后,我们也同时获得了强大的Python标准库,通过使用这些标准库可以为我们节省大量的时间.这里是一些常用标准库的简单说明.更多的标准库的说明,可以参考Python文档 sys 模块 ...

  5. Python标准库概览

    Python标准库通常被称为"自带的电池",自然地提供了广泛的功能,涵盖了大概200个左右的包与模块.不断有高质量的包或模块被开发出来,极大的丰富了标准库.但有些模块放在标准库中很 ...

  6. Python:标准库(包含下载地址及书本目录)

    下载地址 英文版(文字版) 官方文档 The Python Standard Library <Python标准库>一书的目录 <python标准库> 译者序 序 前言 第1章 ...

  7. python第六天 函数 python标准库实例大全

    今天学习第一模块的最后一课课程--函数: python的第一个函数: 1 def func1(): 2 print('第一个函数') 3 return 0 4 func1() 1 同时返回多种类型时, ...

  8. 转--Python标准库之一句话概括

    作者原文链接 想掌握Python标准库,读它的官方文档很重要.本文并非此文档的复制版,而是对每一个库的一句话概括以及它的主要函数,由此用什么库心里就会有数了. 文本处理 string: 提供了字符集: ...

  9. Python 标准库一览(Python进阶学习)

    转自:http://blog.csdn.net/jurbo/article/details/52334345 写这个的起因是,还是因为在做Python challenge的时候,有的时候想解决问题,连 ...

随机推荐

  1. 20175316 盛茂淞 2018-2019-2 《Java程序设计》实验三《敏捷开发与XP实践》 实验报告

    实验内容与要求 1.XP基础 极限编程(Extreme Programming,XP)是一种全新而快捷的软件开发方法.XP团队使用现场客户.特殊计划方法和持续测试来提供快速的反馈和全面的交流: XP是 ...

  2. 菜单特效jq

    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...

  3. Vmware中安装的Ubuntu不能全屏问题解决

    现在有了开源的vmtoll可以下载:open-vm-tools   先安装open-vm-tools:sudo  apt-get install open-vm-tools   然后安装:(不知道具体 ...

  4. Scratch编程:牛顿的苹果——地心引力

    牛顿的苹果 同学们,你们知道牛顿的苹果的故事吗? 传说1665年秋季,牛顿坐在自家院中的苹果树下苦思着行星绕日运动的原因.这时,一只苹果恰巧落下来,它落在牛顿的脚边.就是这个偶尔的瞬间,牛顿发现了苹果 ...

  5. jenkins 打安卓包 cpu使用过高处理操作

    登录两个控制台 打包开始后 在其中一台机器执行ps -ef |grep jenkins 找到执行打包的主进程复制pid 在另一个终端上执行 top -H -p pid 将最耗cpu的线程id转换为16 ...

  6. Ubuntu16.04安装kubernetes1.13集群

    Ubuntu16.04安装kubernetes1.13集群 最新的安装可以使用以下方式:https://www.cnrancher.com/docs/rancher/v2.x/cn/overview/ ...

  7. 【原创】大叔经验分享(94)jdbc连接mysql、sqlserver、oracle

    Mysql driver下载:https://mvnrepository.com/artifact/mysql/mysql-connector-java import java.sql.*; publ ...

  8. 如何判断 Session是否存在

    相信很多人都跟我一样,在写网页中有些位置通过其他网页设置了 Session然后跳转到目标页面就需要要用 Session,但是那个位置如果是直接打开的就用不到 Session,那么问题就来了,例如:系统 ...

  9. JavaScript流程图(精简版)

    网址:https://www.processon.com/view/link/5db4f595e4b0c5553741c271 如果链接失效,请及时反馈(在评论区评论),博主会及时更新

  10. 简单注册表单--HTML练手项目3【Table】

    [本文为原创,转载请注明出处] 技术[HTML]   布局[Table] 步骤1  划分table布局 步骤2 填充内容 文本框+密码框+单选框+复选框+多行文本域+按钮 <input> ...