核对不同文件夹所含内容的差异并提取缺失内容:Python代码
本文介绍基于Python语言,以一个大文件夹作为标准,对另一个大文件夹所包含的子文件夹或文件加以查漏补缺,并将查漏补缺的结果输出的方法。
首先,来明确一下本文所需实现的具体需求。现有一个大文件夹,其中包含了大量子文件夹,如下图所示。
此外,我们还有另一个大文件夹,其中同样包含了大量的子文件夹,如下图所示;从上图与下图中的紫色框可以看出,这是两个不一样的大文件夹。但同时,我们还知道这两个大文件夹中的子文件夹数量,以及每一个子文件夹的名称,几乎是完全一致的——但是下图所示的大文件夹较之上图,缺少了一些子文件夹。
我们现在希望实现的是,以第一幅图所示的大文件夹为标准,对第二幅图所示的大文件夹中的子文件夹加以查漏补缺,找出第二个大文件夹中缺少的子文件夹的名称,以及缺少的子文件夹的数量。
了解了具体需求,我们就可以开始代码的撰写。这里需要注意,本文比较的是两个大文件夹中子文件夹的差异;如果大家希望比较两个大文件夹中文件的差异,整体思路也都是一样的,也可以用本文提供的代码。
本文所用到的具体代码如下所示。
# -*- coding: utf-8 -*-
"""
Created on Tue Feb 21 17:12:47 2023
@author: fkxxgis
"""
import os
template_folder = r"E:\02_Project\01_Chlorophyll\Fishnet\ResultFolder"
new_folder = r"E:\02_Project\01_Chlorophyll\Fishnet\ResultFolder_AI"
folder_list = os.listdir(template_folder)
new_list = os.listdir(new_folder)
num = 0
for folder in folder_list:
if folder not in new_list:
num += 1
print(folder, "is not in new folder!")
print("\n", num, " folder(S) is(are) not in new folder!", sep = "")
可以看到,代码整体也是非常简单的。首先,template_folder
是我们作为标准的大文件夹,也就是本文开头第一幅图所示的文件夹;而new_folder
则是需要对其中子文件夹加以查漏补缺的大文件夹,也就是本文开头第二幅图所示的文件夹。
首先,介绍一下代码的整体思路。
首先,我们基于os.listdir()
函数,遍历标准大文件夹中的每一个子文件夹,获取每一个子文件夹的名称,并将其存放在一个列表中;接下来,我们通过同样的方式,获取待查漏补缺的大文件夹中的子文件夹名称,同样存放在一个列表中。接下来,我们即可开始对比两个大文件夹中子文件夹的数量差异。首先,设置一个变量num
,作为子文件夹数量差异的计算变量;随后,通过一个for
循环,依次取出标准大文件夹中子文件夹的名称,并在待查漏补缺的大文件夹对应的子文件夹名称列表中加以搜索;如果找不到当前名称的子文件夹,说明在第二个大文件夹中就少了这一子文件夹,因此需要将其名称输出,并在变量num
中增加1
。完成上述循环后,我们即可获得第二个大文件夹,也就是待查漏补缺的大文件夹中,所缺少的子文件夹的名称以及其数量。
其次,代码详细的逐句介绍如下。
第一部分,我们需要导入所需的Python内置模块os
,其用于与操作系统进行交互,在本文中就是进行读取文件列表等操作。
随后,我们指定了一个文件夹路径,存储在变量template_folder
中;该文件夹是我们作为标准的大文件夹,即本文开头第一幅图所示的文件夹。接下来,我们继续指定另一个文件夹路径,存储在变量new_folder
中。该文件夹就是需要对其中子文件夹加以查漏补缺的大文件夹,也就是本文开头第二幅图所示的文件夹。
随后,使用os.listdir()
函数获取作为标准的大文件夹中,所有的文件和文件夹的列表,并将其存储在变量folder_list
中;同样的方法,使用os.listdir()
函数获取另一个文件夹中的所有文件和文件夹的列表,并将其存储在变量new_list
中。
接下来,我们初始化一个变量num
,用于计数在模板文件夹中存在,但在新文件夹中不存在的文件夹的数量。随后,即可开始循环,遍历模板文件夹中的每个文件夹,并使用条件判断语句检查这个文件夹是否存在于新文件夹中——如果文件夹不在新文件夹中,则执行以下操作:第一步,将变量num
的值增加1
,用于计数不存在于新文件夹中的文件夹的数量;第二步,打印当前文件夹的名称,以及附加的文本信息。
最后,我们打印最终的结果,显示不存在于新文件夹中的文件夹的数量。
运行上述代码,将会得到如下所示的结果。
代码非常简单,到这里就结束了;如果大家还有其他需求,可以自行再扩充代码。例如,如果希望将待查漏补缺的大文件夹中缺少的子文件夹复制过来,则可以参考文章Python结合文件名称将多个文件复制到不同路径下中所提到的代码思路加以实现。
至此,大功告成。
核对不同文件夹所含内容的差异并提取缺失内容:Python代码的更多相关文章
- Windows下对文件夹下所有图片批量重命名(附C++,python,matlab代码)
https://blog.csdn.net/u011574296/article/details/72956446: Windows下对文件夹下所有图片批量重命名(附C++,python,matlab ...
- python批量修改一个文件夹下含多个文件夹中的所有图片名称
网上能找到的,大多是只对一个文件夹下所有图片进行重命名的代码. 这边实现的是,一个文件夹下有多个文件夹内图片的重命名. rename.py #!/usr/bin/python # -*- coding ...
- [转载] 与WIN不同,linux替换文件夹会删除原文件夹下的全部内容!
今天差点把源码给覆盖掉了><...555... 虚惊一场!!看了一篇博客分析这种情况.我的环境是CentOS5.5,不会出现文件夹直接被覆盖的情况,但是在Linux下不要用Win下的一些直 ...
- hdfs中删除文件、文件夹、抓取内容
删除文件 bin/hdfs dfs -rm output2/* 删除文件夹 bin/hdfs dfs -rm -r output2 抓取内容 bin/hdfs dfs -cat /us ...
- bat 批处理切换到当前脚本所在文件夹
bat 批处理切换到当前脚本所在文件夹 切换到当前脚本所在的文件夹 ? 1 cd %~dp0 另外附上一些bat基本内容 —————————————————————————————— 批处理常用 ...
- Windows Store App JavaScript 开发:获取文件和文件夹列表
在应用程序中有时可能需要获取用户库中的内容,以便执行相关的操作.如果要获取某个用户库中的内容,需要先获取到这个用户库,获得用户库可以通过Windows.Storage命名空间中的KnownFolder ...
- 文件夹同步/备份软件推荐 (SyncToy/FreeFileSync/Compare Advance/GoodSync/Allway Sync/Compare Advance)
关于文件同步的文章,已经很多次出现在异次元上了,因为它们很多都能实实在在提高工作便利性.比方说有我们熟悉的云端同步软件 Dropbox.金山快盘,以及曾经还介绍过可本地使用的 Allway Sync ...
- 365DirMon(文件夹监视专家) v2.8绿色免费版
软件名称:365DirMon(文件夹监视专家)软件语言: 简体中文授权方式: 免费软件运行环境: Win 32位/64位软件大小: 1.6M 图片预览: 软件简介:365DirMon 是一可以监控磁盘 ...
- Linux下 两台机器文件/文件夹 相互拷贝
Linux下 两台机器文件/文件夹 相互拷贝 设有两台机器 :A:*.101及 B:*.102. 把A下的.temp/var/a.txt拷贝到B机器的/text/目录下: 进入B机器:scp root ...
- 修改windows user 文件夹中的用户名
假设我们需要将帐户A改名为B.首先我们需要用另一个管理员帐户C登陆系统. 1.在控制面板-〉用户帐户中将帐户A改名为B. 2.打开C:/Users或"用户"文件夹,将文件夹A重命名 ...
随机推荐
- linux上PGI编译器安装
1.PGI编译器介绍 随着英伟达的收购,PGI编译器已经已经并入NVIDIA HPC SDK.后面直接安装NVIDIA HPC SDK即可. NVIDIA HPC SDK提供了使用标准的C/C++和F ...
- AI回答总不满意?你的提问方式可能完全错误!
AI回答总不满意?你的提问方式可能完全错误! 大家好,我是卷福同学,一个专注AI大模型整活的前阿里程序员,腾讯云社区2023新秀突破作者 向AI提问想写一篇论文,结果AI就生成2000字左右的文章后就 ...
- C数据结构:树和森林存储方式与遍历方式
文章目录 树的存储方式 双亲表示法 孩子链表表示法 孩子兄弟表示法(二叉树表示法) 树和二叉树的转换 森林和二叉树的转换 树和森林的遍历 树的遍历方式 森林的遍历方式 浅谈一下几个问题 为什么树没有中 ...
- Swoole 实践篇之结合 WebRTC 实现音视频实时通信方案
原文首发链接:Swoole 实践篇之结合 WebRTC 实现音视频实时通信方案 大家好,我是码农先森. 引言 这次实现音视频实时通信的方案是基于 WebRTC 技术的,它是一种点对点的通信技术,通过浏 ...
- iNeuOS工业互联网操作系统,增加电力IEC104协议
1. 概述... 2 2. 配置IEC104协议设备驱动... 2 1. 概述 IEC60870-5-104 是一种电力自动化系统中常用的通信协议,使用 TCP/IP 协议作为 ...
- NumPy 泊松分布模拟与 Seaborn 可视化技巧
泊松分布 简介 泊松分布是一种离散概率分布,用于描述在给定时间间隔内随机事件发生的次数.它常用于模拟诸如客户到达商店.电话呼叫接入中心等事件. 参数 泊松分布用一个参数来定义: λ:事件发生的平均速率 ...
- Windows库链接报错
问题回溯 今天拿到别人已经编译好的库,发现在链接的时候出现了报错 [9/9 12.7/sec] Linking CXX shared module bin\plugins\AsensingPlugin ...
- 利用QEMU模拟大端序机器
简介 当前我们安装虚拟机,一般小端机器比较多,有时候想模拟大端机器测试程序,这时就有模拟大端机器的需求. 参考:利用 QEMU USER 模式运行 mips 程序 - sinpo828 - 博客园 ( ...
- dom基本获取 标签文本操作
// 总结: // 1, 通过id属性值,获取标签对象 // document.getElementById() // 一个标签对象 ...
- 连续段 dp - 状态转移时依赖相邻元素的序列计数问题
引入 在一类序列计数问题中,状态转移的过程可能与相邻的已插入元素的具体信息相关. 这类问题通常的特点是,如果只考虑在序列的一侧插入,问题将容易解决. 枚举插入顺序的复杂度通常难以接受,转移时枚举插入位 ...