小书匠python

使用Python脚本的过程中,偶尔需要使用list多层转一层,又总是忘记怎么写搜索关键词,所以总是找了很久,现在把各种方法记录下来,方便自己也方便大家.

方法很多,现在就简单写8种,后面再对这8种方法做基准测试.

声明:文中的方法均收集自Making a flat list out of list of lists in Python


1.定义减层方法

  1. import functools 

  2. import itertools 

  3. import numpy 

  4. import operator 

  5. import perfplot 

  6. from collections import Iterable # or from collections.abc import Iterable 

  7. from iteration_utilities import deepflatten 


  8. #使用两次for循环 

  9. def forfor(a): 

  10. return [item for sublist in a for item in sublist] 


  11. #通过sum 

  12. def sum_brackets(a): 

  13. return sum(a, []) 


  14. #使用functools內建模块 

  15. def functools_reduce(a): 

  16. return functools.reduce(operator.concat, a) 


  17. #使用itertools內建模块 

  18. def itertools_chain(a): 

  19. return list(itertools.chain.from_iterable(a)) 


  20. #使用numpy 

  21. def numpy_flat(a): 

  22. return list(numpy.array(a).flat) 


  23. #使用numpy 

  24. def numpy_concatenate(a): 

  25. return list(numpy.concatenate(a)) 


  26. #自定义函数 

  27. def flatten(items): 

  28. """Yield items from any nested iterable; see REF.""" 

  29. for x in items: 

  30. if isinstance(x, Iterable) and not isinstance(x, (str, bytes)): 

  31. yield from flatten(x) 

  32. else: 

  33. yield x 


  34. def pylangs_flatten(a): 

  35. return list(flatten(a)) 


  36. #使用库iteration_utilities 

  37. def iteration_utilities_deepflatten(a): 

  38. return list(deepflatten(a, depth=1)) 

2.测试

  1. a=[[1,2,3],[4,5,6],[7,8,9]] 

  2. print(a) 


  3. print('--------------------------') 


  4. print(forfor(a)) 

  5. print(sum_brackets(a)) 

  6. print(functools_reduce(a)) 

  7. print(itertools_chain(a)) 

  8. print(numpy_flat(a)) 

  9. print(numpy_concatenate(a)) 

  10. print(pylangs_flatten(a)) 

  11. print(iteration_utilities_deepflatten(a)) 

输出:

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

--------------------------

[1, 2, 3, 4, 5, 6, 7, 8, 9]

[1, 2, 3, 4, 5, 6, 7, 8, 9]

[1, 2, 3, 4, 5, 6, 7, 8, 9]

[1, 2, 3, 4, 5, 6, 7, 8, 9]

[1, 2, 3, 4, 5, 6, 7, 8, 9]

[1, 2, 3, 4, 5, 6, 7, 8, 9]

[1, 2, 3, 4, 5, 6, 7, 8, 9]

[1, 2, 3, 4, 5, 6, 7, 8, 9]


2.各种方法的基准测试(消耗时间对比)

各种方法在小数据上消耗时间差别不大,如果数据很小,没必要为了选择而烦恼,如果数据很大,可以参考下面基准测试的结果来选择减层方法.

  1. import matplotlib.pyplot as plt 

  2. from simple_benchmark import benchmark 


  3. #基准测试 

  4. b = benchmark( 

  5. [forfor, sum_brackets, functools_reduce, itertools_chain,numpy_flat, numpy_concatenate, pylangs_flatten,iteration_utilities_deepflatten], 

  6. arguments={2**i: [[0]*5]*(2**i) for i in range(1, 13)}, 

  7. argument_name='number of inner lists' 




  8. #显示测试结果 

  9. plt.subplots(1,1,figsize=(15,10)) 

  10. b.plot() 

  11. plt.legend(loc = 'upper left') 

  12. plt.show() 


消耗时间对比

相同数据量,纵轴方向越小,方法越快.


代码可以从这里下载,需要部署Jupyter环境,可参考我的博客部署方法.

Python中多层List展平为一层的更多相关文章

  1. python中多层循环的一键退出

    在单层循环的退出中,使用break即能退出,那么多层循环呢?机智的人们使用flag标识符的方式,例如: a=['a',1,2,3,4] b=['b',1,2,3,4] c=['c',1,2,3,4] ...

  2. ZBrush中Flatten展平笔刷介绍

    本文我们来介绍ZBrush®中的Flatten展平笔刷,Flatten笔刷能增加粗糙的平面在模型表面,利用它能够制作出完全的平面. Flatten展平笔刷 Flatten(展平):Flatten笔刷可 ...

  3. Python中的列表生成式和多层表达式

    Python中的列表生成式和多层表达式 如何生成[1x1, 2x2, 3x3, ..., 10x10]的列表? L=[]; ,): L.append(x*x) print L print (" ...

  4. python中sys和os模块的使用

    在python中,sys,os模块是非常强大的,提供了许多对文件夹.文件和路径的操作方法 sys模块 sys.argv   #命令行执行脚本,其实它就是一个列表 ,sys.argv[0] 是程序自身路 ...

  5. Python中命名空间与作用域使用总结

    1 引言 命名空间与作用域是程序设计中的基础概念,深入理解有助于理解变量的生命周期,减少代码中的莫名其妙bug.Python的命名空间与作用域与Java.C++等语言有很大差异,若不注意,就可能出现莫 ...

  6. Python中赋值、浅拷贝与深拷贝

    python中关于对象复制有三种类型的使用方式,赋值.浅拷贝与深拷贝.他们既有区别又有联系,刚好最近碰到这一类的问题,研究下. 一.赋值 在python中,对象的赋值就是简单的对象引用,这点和C++不 ...

  7. python中的函数名,闭包,迭代器

    一.函数名 函数名是一个变量,但它是一个特殊的变量,与括号配合可以执行函数的变量,单纯print()出的是一个内存地址. def func(): print('你说你有点难追') print(func ...

  8. (数据科学学习手札101)funcy:Python中的函数式编程百宝箱

    本文示例文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 我们在使用Python完成日常任务时,经常会遇到 ...

  9. Python中关于进度条的6个实用技巧

    1 简介 费老师我在几年前写过的一篇文章(https://www.cnblogs.com/feffery/p/13392024.html)中,介绍过tqdm这个在当下Python圈子中已然非常流行的进 ...

随机推荐

  1. postgres 序列

    postgres序列(serial)和类型:https://www.cnblogs.com/alianbog/p/5654604.html 序列:https://www.cnblogs.com/mch ...

  2. 2.5_Database Interface ODBC数据源及案例

    分类 用户数据源 用户创建的数据源,称为“用户数据源”.此时只有创建者才能使用,并且只能在所定义的机器上运行.任何用户都不能使用其他用户创建的用户数据源. 系统数据源 所有用户在Windows下以服务 ...

  3. C#破解dll

    使用反编译工具对dll文件进行反编译,找到校验过期的相关代码,反编译工具可以使用ILSpy或Reflector; 使用ildasm.exe工具将dll导出成il文本文件,在该文件中找到相关的代码进行修 ...

  4. Ubuntu18.04防火墙相关

    Ubuntu 18.04 LTS 系统中已经默认附带了 UFW 工具,如果您的系统中没有安装,可以在「终端」中执行如下命令进行安装: sudo apt install ufw 检查UFW状态 sudo ...

  5. Base64图片编码的使用

    一.base64编码介绍 Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一,Base64编码可用于在HTTP环境下传递较长的标识信息.采用Base64编码具有不可读性,即所编码的数据 ...

  6. js 页面技巧

    需要获取页面上固定的某个按钮的属性值.我们需要在页面加载完的第一刻将值存储到定义的变量,防止用户更改页面样式读不出当前元素.如果页面刷新会重置当前属性 <body> <input v ...

  7. 【洛谷 P3804】 【模板】后缀自动机

    题目链接 #include <cstdio> #include <cstring> #include <algorithm> using namespace std ...

  8. XnViewer管理浏览照片、图片

    有时候拍完照片想要浏览照片.浏览照片的时候想做一些标记,这个时候就需要使用照片管理器: 之前一直使用谷歌的picasa(不更新了),adobe也有个管理器(比较大):这里主要推荐一个: https:/ ...

  9. RedHat6.9下替换yum源

    因为RedHat的yum需要收费,且要注册后才能使用.因此想把Yum源更新为CentOS的.使用的RedHat版本为6.9,因此对应的CentOS版本也要为6.9 1. 检查并删除原有的yum源 rp ...

  10. 几个不错的echarts +百度地图 案例

    https://echarts.baidu.com/examples/editor.html?c=map-polygon https://echarts.baidu.com/examples/edit ...