C盘又满了,怎么办?用了一些垃圾清理软件(或者bat脚本),但是还是不理想,那么具体哪些文件夹下面有巨大的文件呢?windows并不能通过详细信息看到每个文件夹的大小(PS:这里所谓的文件夹的大小是指文件夹下面所有文件的大小之和,包括子文件夹的大小,下同),道理也很简单,计算文件夹大小是比较费时的工作。当然,也可以通过属性查看文件夹大小,但是当一个文件夹下面又有及半个子文件夹的时候,怎么知道哪些比较大的,这个时候不禁想起了linux下面的du命令。

  du(disk usage)是查看磁盘使用情况非常有用的一个工具(另外一个是df),具体的使用文档可以参见链接。而本人最常使用的参数是这样的:

  du . -h -d 1

  上述命令输出当前文件夹(.)下面 第一层(-d 1)子文件夹的大小,以human readable(-h)的形式展现, 下面是实际例子:

  

  

  那windows下面并没有这样一个简单的命令(或者是我不知道?),不过无所谓,用python应该比较简单:

  1. # -*- coding: utf-8 -*-
  2. import os, sys
  3.  
  4. def get_path_depth(root, dirpath):
  5. return dirpath.count(os.path.sep) - root.count(os.path.sep)
  6.  
  7. def human_readable(plain_size):
  8. plain_size = float(plain_size)
  9. if plain_size <= 1024:
  10. return str( round(plain_size, 2)) + 'B'
  11. if plain_size <= 1024 * 1024:
  12. return str( round(plain_size / 1024, 2)) + 'K'
  13. if plain_size <= 1024 * 1024 * 1024:
  14. return str( round(plain_size / 1024 / 1024, 2)) + 'M'
  15. if plain_size <= 1024 * 1024 * 1024 *1024:
  16. return str( round(plain_size / 1024 / 1024 / 1024, 2)) + 'G'
  17.  
  18. def main(root, max_depth, min_size_byte):
  19. total_size = 0
  20. dir_size = {}
  21. for dirpath, dirnames, filenames in os.walk(root):
  22. cur_depth = get_path_depth(root, dirpath)
  23.  
  24. if cur_depth <= max_depth:
  25. assert dirpath not in dir_size
  26. dir_size[dirpath] = 0
  27.  
  28. for filename in filenames:
  29. fullpath = os.path.join(dirpath, filename)
  30. filesize= os.path.getsize(fullpath)
  31.  
  32. total_size += filesize
  33. for dirname in dir_size:
  34. if dirpath == dirname or dirpath.startswith(dirname + os.path.sep):
  35. dir_size[dirname] += filesize
  36.  
  37. root_size = len(root)
  38. for dirname, plain_size in sorted(dir_size.iteritems(), key = lambda d : d[1], reverse = True):
  39. if plain_size < min_size_byte:
  40. break
  41. print human_readable(plain_size), '\t.', dirname[root_size: ]
  42.  
  43. if __name__ == '__main__':
  44. if len(sys.argv) <= 1:
  45. assert False, 'usage show_dir_size path max_depth(with default 0) min_size_byte(with default 1)'
  46. root = sys.argv[1]
  47. if root.endswith(os.path.sep):
  48. root = root[: -1]
  49. max_depth = int(sys.argv[2]) if len(sys.argv) >= 3 else 0
  50. min_size_byte = int(sys.argv[3]) if len(sys.argv) >= 4 else 0
  51. main(root, max_depth, min_size_byte)

  三个参数,第一个是文件夹(path);第二个是显示子文件夹的层数(max_depth, 默认为0); 第三个字数限制文件夹带下(min_size_byte),即size小于这个值得文件夹就不显示了,默认值为1。

  上述代码使用了两个比较关键的函数:os.walk, 遍历路径下的所有文件夹和文件,注意该函数本身就会递归显示子文件夹的内容;第二个函数是os.path.getsize,获取一个文件的大小。

  windows下试一试:

  

  Linux下面试一试:

  

references:

du

python计算文件夹大小(linux du命令 简化版)的更多相关文章

  1. Linux下查看文件和文件夹大小 df,du命令

    转自 http://www.cnblogs.com/benio/archive/2010/10/13/1849946.html df可以查看一级文件夹大小.使用比例.档案系统及其挂入点,但对文件却无能 ...

  2. python计算文件夹大小——os.walk

    下面提供一种利用os.walk()快捷的计算指定文件夹大小的方法 话不多说,直接上代码 简略版: import os def get_file_size(file_path, size=0): for ...

  3. Python_计算文件夹大小

    计算文件夹大小 os.listdir('dirname') 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印 os.path.join(path1[, path2[, ...]]) 将 ...

  4. python 计算文件夹里所有内容的大小总和

    计算文件夹里所有内容的大小总和 递归方法 '''计算文件夹的大小''' import os def dir_file_size(path): if os.path.isdir(path): file_ ...

  5. python 获取文件夹大小

    __author__ = 'bruce' import os from os.path import join,getsize def getdirsize(dir): size=0l for (ro ...

  6. Linux下查看磁盘剩余空间和文件夹大小

    1. du -sh 查看当前文件夹大小 2. du -sh * | sort -n 列出当前文件夹下的所有文件夹及其大小,并按照文件夹大小排序 du - sh *  //查看当前文件夹下所有文件的大小 ...

  7. Linux查看一个文件夹大小

    1.Linux查看一个文件夹大小: du -sh /home/yangkun [yangkun@sg1 bin]$ du -sh /home/yangkun/ 164M /home/yangkun/ ...

  8. Linux C++获取文件夹大小

    项目中要计算指定文件夹的大小.百度查到这篇文章,https://my.oschina.net/Tsybius2014/blog/330628方法可行,运行正确. 拿到我们的项目中,却遇到一些问题:程序 ...

  9. NSFileManager计算文件/文件夹大小

    在一些软件中,一般都会给用户展现当前APP的内存,同时用户可以根据自己的需要来清除缓存的内容.一般而言,文件夹是没有大小这个属性的,所以需要遍历文件夹的内容来计算文件夹的大小,下面用NSFileMan ...

随机推荐

  1. 性能监控之Java程序执行解析

    大家好,最近接触javassist技术,研究过程中对Java程序执行过程进行了一系列探索,弄清楚了几个盲区(仅针对个人而言),现将经验与大家分享. 1.编码->.java 通常指写代码的过程,最 ...

  2. “权限系统_基于HUI”的简单介绍和交流

    昂,最近比较闲,写了个权限系统. 后端框架还是老样子,基于本人自己搭建的后台基础开发框架"Spring_Mvc_EF":前端框架,我挑选了一阵子,最后选用了HUI前端开发框架,因为 ...

  3. Masonry的简单使用

    #import "RootViewController.h" #import "Masonry.h" @interface RootViewController ...

  4. linux文本处理常用指令总结

    引子 作为一个偏爱windows的程序员,以前做文本处理的时候总是喜欢在windows下用notepad++等图形化工具处理,比如有时需要把linux服务器上一个文件进行一次全局字符串替换这样简单的操 ...

  5. 四色GDOI&GDOI2015滚粗记

    好吧自己太弱写不了什么四色NOI只能学学别人写个四色GDOI了...首先自己还是太弱所以就被学校卡了个名额就进不了省队了QAQ.自己GDOI觉得考得不错可是NOIP毕竟少了人家5分根本追不上去好不QA ...

  6. BZOJ 3410: [Usaco2009 Dec]Selfish Grazing 自私的食草者(贪心)

    这= =,就是线段覆盖对了= =直接贪心就行了= = CODE: #include<cstdio>#include<iostream>#include<cstring&g ...

  7. RDLC系列(一)ASP.NET RDLC 报表自定义数据源

    最近一段时间开发ERP系统中要用到不少报表打印,在网上找了一圈发现想些好用的报表控件大部分要收费,一些面免费要么不好用要么IE8不兼容,最后还是用了微软自带的RDLC报表,把自己遇到的坑和技巧整理分享 ...

  8. IOS高级开发~开机启动&无限后台运行&监听进程

    一般来说, IOS很少给App后台运行的权限. 仅有的方式就是 VoIP. IOS少有的为VoIP应用提供了后台socket连接,定期唤醒并且随开机启动的权限.而这些就是IOS上实现VoIP App的 ...

  9. JNI调用的helloworld(JNI_OnLoad映射方式)

    本示例展示JNI的基本示例,helloworld级别的,不过是用JNI_OnLoad映射的方式. 直接看代码,先看包含native method的Person.java的代码: package hel ...

  10. 前端跨域方案-跨域请求代理(node服务)

    前端开发人员在本地搭建node服务,调用接口首先走本地服务,然后转发到api站点,node服务代码如下: var express = require('express'), request = req ...