Python标准库pathlib及实例操作

https://docs.python.org/zh-cn/3.9/library/pathlib.html 官网

讲的比较好的文章 https://zhuanlan.zhihu.com/p/139783331

简介

  • 该模块提供表示文件系统路径的类,其语义适用于不同的操作系统

优点(对比os.path)

  • 老的路径操作函数管理比较混乱,有的是导入 os, 有的又是在 os.path 当中,而新的用法统一可以用 pathlib 管理。
  • 老用法在处理不同操作系统 win,mac 以及 linux 之间很吃力。换了操作系统常常要改代码,还经常需要进行一些额外操作。
  • 老用法主要是函数形式,返回的数据类型通常是字符串。但是路径和字符串并不等价,所以在使用 os 操作路径的时候常常还要引入其他类库协助操作。新用法是面向对象,处理起来更灵活方便。
  • pathlib 简化了很多操作,用起来更轻松

详解

获取文件路径

  • 语法

    Path(__file__)   #__file__是当前文件的绝对路径
    
    Path(__file__).parent  #所在目录
    Path(__file__).parent.parent #所在目录的父目录 Path(文件的相对路径)
    Path(__file__).resolve() #仍然可以得到绝对路径 Path(__file__).parent / 'filename' #目录拼接文件名 用/
  • 示例1

    from pathlib import Path
    print(Path.cwd()) #你当前py文件的所在目录,类似于pwd
    print(Path.home()) #你当前用户的家目录(windows比如C:\Users\用户名)
  • 示例2

    # demo_pathlib.py
    from pathlib import Path
    file_abs_path = Path(__file__)
    print('对象类型是: ',type(file_abs_path)) #pathlib.WindowsPath
    print('当前文件的绝对路径:',file_abs_path)
    file_relative_path = Path('demo_pathlib.py')
    print('当前文件的相对路径:',file_relative_path)
    print('当前文件的绝对路径(另外一种写法):',file_relative_path.resolve()) parent_dir = Path(__file__).parent #还可以继续.parent,相当于cd ..和cd ../..
    print('当前文件的父目录:',parent_dir)
    print('路径拼接用/(忽略操作系统差异): ',parent_dir / file_relative_path) #
  • 注意

    • 不管字符串使用的是正斜杠 / 还是反斜杠 \, 在 windows 系统里,得到的路径都是反斜杠\, pathlib 会根据操作系统智能处理

获取路径组成部分

from pathlib import Path
saolei_apk = Path(r'd:\com.kejia.mine.apk')
print(saolei_apk.name)
属性 说明
name 文件名,包含后缀名,如果是目录则获取目录名
stem 文件名,不包含后缀。
suffix 后缀,比如 .txt, .png
parent 父级目录,相当于 cd ..
anchor 锚,目录前面的部分 C:\ 或者 /
  • 多级目录

    from pathlib import Path
    saolei_apk = Path(r'D:\software\aDrive\locales\am.pak')
    for parent in saolei_apk.parents:
    print(parent)
    D:\software\aDrive\locales
    D:\software\aDrive
    D:\software
    D:\
    • 如果是os模块,要获取其父目录用的是os.path.dirname(),多级目录的话就麻烦,对比一下

      import os
      os_saolei_apk_dir = os.path.dirname(r'D:\software\aDrive\locales\am.pak')
      print(os_saolei_apk_dir)
      os_saolei_apk_parent_dir = os.path.dirname(os.path.dirname(r'D:\software\aDrive\locales\am.pak'))
      print(os_saolei_apk_parent_dir) from pathlib import Path
      pathlib_saolei_apk = Path(r'D:\software\aDrive\locales\am.pak')
      print(pathlib_saolei_apk.parent)
      print(pathlib_saolei_apk.parent.parent) #就相当于cd..多次
      print(pathlib_saolei_apk.parents[1]) #你还可以用parents,注意0是第一层所在目录,1是父目录,2是爷目录....

获取文件属性

from pathlib import Path

saolei_apk = Path(r'd:\com.kejia.mine.apk')
print(saolei_apk.stat())
#os.stat_result(st_mode=33206, st_ino=562949953558668, st_dev=3393479561, st_nlink=1, st_uid=0, st_gid=0, st_size=698179, st_atime=1648601046, st_mtime=1631589296, st_ctime=1631952752) mtime = saolei_apk.stat().st_mtime
print(arrow.get(mtime).format('YYYY-MM-DD HH:MM:SS'))
属性 说明
st_mode 权限模式
st_ino inode number
st_dev device
st_nlink 硬链接数
st_uid 所属用户的user id
st_gid 所属用户的group id
st_size 文件的大小,以位为单位
st_atime 文件访问时间
st_mtime 文件修改时间
st_ctime 文件创建时间
  • 注意3个时间都是时间戳,要获取好看的时间就用arrow(详见我的另外一篇博文Python第三方库_arrow)来获取。

文件(夹)操作

  • 慎用!推荐用shutil

  • 示例

    from pathlib import Path
    newfile = Path(r'D:\20220402.txt')
    if not newfile.exists():
    print('创建文件')
    newfile.touch(exist_ok=False)
    else:
    print('删除文件')
    newfile.unlink()
操作 说明
exists() 是否存在
is_dir() 是否是文件
is_file() 是否是目录
touch(mode=0o666, exist_ok=True) 创建文件,默认权限666,如果exist_ok为True,文件存在不做任何事情,若为False,文件存在执行touch会报错FileExistsError
unlink() 删除文件!危险操作!
rmdir() 删除目录非常危险,并且没有提示,一定要谨慎操作。一次只删除一级目录,且当前目录必须为空
mkdir() 创建目录
read_text() 读文件内容,不再需要重复去打开文件和管理文件的关闭了,下同
read_bytes() 读取bytes
write_text 写入文本,注意是w 模式,如果之前已经有文件内容,将会被覆盖
write_bytes 写入bytes
replace(文件新路径) 移动文件
  • 重命名

    txt_path = Path('archive/demo.txt')
    new_file = txt_path.with_name('new.txt')
    txt_path.replace(new_file)
  • 改后缀

    txt_path = Path('archive/demo.txt')
    new_file = txt_path.with_suffix('.json')
    txt_path.replace(new_file)

实例

批量移动

  • 现在有这个目录

    E:\test (6.5KB)
    +-- 1 (6.5KB)
    | +-- 1.txt (0b)
    | `-- 1.xls (6.5KB)
    `-- 2
    `-- 2.txt (0b)
  • 移动所有子目录下的.txt文件到E:\test这个根目录下

    from pathlib import Path
    def move_file_to(srcdir,dstdir,file_pattern):
    file = Path(srcdir).rglob(file_pattern)
    for _ in file:
    Path(_).replace(Path(dstdir) / Path(_).name) move_file_to(srcdir=r'e:\test',dstdir=r'e:\test',file_pattern='*.txt')

批量修改后缀

  • 还是上面的目录结构

    E:\test (6.5KB)
    +-- 1 (6.5KB)
    | +-- 1.txt (0b)
    | `-- 1.xls (6.5KB)
    `-- 2
    `-- 2.txt (0b)
    from pathlib import Path
    def change_suffix(dst_dir,old_suffix,new_suffix):
    file = Path(dst_dir).rglob('*.'+old_suffix)
    if list(file):
    for _ in file:
    new_ = Path(_).with_suffix('.'+new_suffix)
    Path(_).replace(new_)
    else:
    raise Exception(f'file-type:{old_suffix} not found(recursive) in {dst_dir}')
    change_suffix(dst_dir=r'e:\test',old_suffix='txt',new_suffix='docx')
  • 修改后

    $ tree
    E:\test (6.5KB)
    +-- 1 (6.5KB)
    | +-- 1.docx (0b)
    | `-- 1.xls (6.5KB)
    `-- 2
    `-- 2.docx (0b)
    • rglob是递归,glob只会找一个目录下
    • glob得到的是一个生成器,可以用list来转化成列表

统计目录下的文件类型

  • 还是刚才的目录结构

    E:\test (6.5KB)
    +-- 1 (6.5KB)
    | +-- 1.txt (0b)
    | `-- 1.xls (6.5KB)
    `-- 2
    `-- 2.txt (0b)
  • 示例代码

    import collections
    from pathlib import Path
    path = Path(r'e:\test\1')
    files = [f.suffix for f in path.iterdir() if f.is_file()]
    print(dict(collections.Counter(files))) #{'.txt': 1, '.xls': 1}
  • 但是上面的代码不能递归,就是当前目录下的文件的类型

  • 改造一下

    import collections
    from pathlib import Path
    path = Path(r'e:\test')
    files = [f.suffix for f in path.rglob('*.*') if f.is_file()]
    print(dict(collections.Counter(files)))

统计某个目录下最近修改的文件

  • 转载知乎原文的代码

    from pathlib import Path
    path = Path.cwd()
    print(max(
    [(f.stat().st_mtime, f)
    for f in path.iterdir()
    if f.is_file()]
    ))
    • 也不能递归,你知道怎么改吗?

Python标准库pathlib及实例操作的更多相关文章

  1. python第六天 函数 python标准库实例大全

    今天学习第一模块的最后一课课程--函数: python的第一个函数: 1 def func1(): 2 print('第一个函数') 3 return 0 4 func1() 1 同时返回多种类型时, ...

  2. 一个超好用的 Python 标准库,彻底玩透路径操作

    pathlib 学习 Python 时,尤其是在进行文件操作和数据处理时,经常会处理路径问题.最常用和常见的是 os.path 模块,它将路径当做字符串进行处理,如果使用不当可能导致难以察觉的错误,而 ...

  3. python标准库之字符编码详解

    codesc官方地址:https://docs.python.org/2/library/codecs.html 相关帮助:http://www.cnblogs.com/huxi/archive/20 ...

  4. [python标准库]Pickle模块

    Pickle-------python对象序列化 本文主要阐述以下几点: 1.pickle模块简介 2.pickle模块提供的方法 3.注意事项 4.实例解析 1.pickle模块简介 The pic ...

  5. Python 标准库一览(Python进阶学习)

    转自:http://blog.csdn.net/jurbo/article/details/52334345 写这个的起因是,还是因为在做Python challenge的时候,有的时候想解决问题,连 ...

  6. Python标准库笔记(9) — functools模块

    functools 作用于函数的函数 functools 模块提供用于调整或扩展函数和其他可调用对象的工具,而无需完全重写它们. 装饰器 partial 类是 functools 模块提供的主要工具, ...

  7. Python 标准库之 xml.etree.ElementTree

    Python 标准库之 xml.etree.ElementTree Python中有多种xml处理API,常用的有xml.dom.*模块.xml.sax.*模块.xml.parser.expat模块和 ...

  8. Python标准库、第三方库和外部工具汇总

    导读:Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库.函数和外部工具.其中既有Python内置函数和标准库,又有第三方库和工具. 这些库可用于文件读写.网络抓取和解析.数据连 ...

  9. Python 标准库、第三方库

    Python 标准库.第三方库 Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库.函数和外部工具.其中既有Python内置函数和标准库,又有第三方库和工具.这些库可用于文件读写 ...

  10. 140种Python标准库、第三方库和外部工具

    导读:Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库.函数和外部工具.其中既有Python内置函数和标准库,又有第三方库和工具. 这些库可用于文件读写.网络抓取和解析.数据连 ...

随机推荐

  1. XMind2022安装激活

    1. 下载XMind2021并安装​ 2. 激活安装 2.1 找到需要替换文件的目录右击软件,打开文件所在的位置(默认路径:C:\Program Files\XMind),找到resources文件夹 ...

  2. php 程序员进化之路

    1.目标明确 2.消除干扰 3.自我激励 鸟哥 --2018年11月17日php年会

  3. .NET性能优化-使用内存+磁盘混合缓存

    我们回顾一下上一篇文章中的内容,有一个朋友问我这样一个问题: 我的业务依赖一些数据,因为数据库访问慢,我把它放在Redis里面,不过还是太慢了,有什么其它的方案吗? 其实这个问题比较简单的是吧?Red ...

  4. Linux系统安装 tftp服务 NFS服务

    安装tftp服务 安装 sudo apt-get install tftp-hpa tftpd-hpa 配置文件 # /etc/default/tftpd-hpa TFTP_USERNAME=&quo ...

  5. 微服务---Dubbo+Zookeeper

    dubboAdmin客户端 --监控 && 启动 Zookeeper 客户端 --注册中心 生产者: <?xml version="1.0" encoding ...

  6. SocketException 不知道这样的主机(Quartz.;Dns.GetHostEntry;new HttpChannel)问题记录

    今天发现自己封装的一个Quartz服务无法启动了,跟踪代码才发现了一个问题是因为数字计算机名称导致的,修改了下计算机名称解决了问题.

  7. integer 拆箱装箱以及范围

    //装箱是将一个原始数据类型赋值给相应封装类的变量.而拆箱则是将一个封装类的变量赋值给相应原始数据类型的变量. int i1 = 1; int i2 = 1; Integer integer1 = n ...

  8. windows error LNK2019

    温馨提示,请使用ctrl+F进行快速查找 ws2_32.lib error LNK2001: 无法解析的外部符号 __imp_htons error LNK2001: 无法解析的外部符号 __imp_ ...

  9. Excel2010表格内容被加密,无法编辑内容。

    Sub PasswordBreaker() Dim i As Integer, j As Integer, k As Integer Dim l As Integer, m As Integer, n ...

  10. python中文件操作相关基础知识

    python中文件操作相关基础知识 文件的概念 1,文件的概念? 文件就是操作系统暴露给用户操作硬盘的快捷方式 , 当我们双击一个文件进行打开时,其实就是把硬盘中的数据加载到了内存中,然后展示给我们 ...