Python选择指定文件夹的文件然后复制出其中几个文件到新的文件夹
"""
要求:
1.读取cdm文件的所有子文件夹,然后每个文件夹里面是抽出一个一个mp3后缀的文件。
遍历所有的子文件,然后将这些mp3文件,保存到一个新的文件夹。文件夹后缀是当前文件的年代的
基础加后缀_single,例如:来自2000年文件夹就命名2000_single。
"""
import shutil
import pathlib
import pprint
from typing import List, Generator, Iterable, Tuple
from itertools import chain, islice
import os
from concurrent.futures import ThreadPoolExecutor, ProcessPoolExecutor
from functools import partial
import traceback
import time
from multiprocessing import cpu_count
DIR_PATH = pathlib.Path("/Users/chennan/CDM")
MAX_CONCCURENT = cpu_count() * 4 - 2
def multiple_file_types(file_path: Generator, *patterns: Tuple[str]) \
-> Iterable:
"""
因为glob不支持多个匹配规则,所以这里做一个适配。
:param file_path: 文件的路径
:param patterns: 匹配规则
:return:
"""
return (file_path.glob(pattern) for pattern in patterns)
def get_all_list_by_year(y: str) -> Generator:
"""
:param y: 年代
:return: 返回结果迭代器类型
"""
file_path = DIR_PATH / y
result = file_path.glob("*")
return result
def get_mp3_list(cdm_path: str) -> Generator:
"""
获取当前文件下面的所有音频文件,mp3,wav,ape,flac等
:param cdm_path:专辑的路径
:return:
"""
mp3_gen = multiple_file_types(cdm_path, *("*.mp3", "*.ape", "*.wav", "*.flac"))
return mp3_gen
def select_mp3(y: str) -> List[pathlib.Path]:
"""
:param y:
:return:
"""
selected_mp3_list = []
sa = selected_mp3_list.append
cdm_list = get_all_list_by_year(y)
for dir_path in cdm_list:
mp3_gen = get_mp3_list(dir_path)
try:
single = mp3_gen.send(None)
sa(list(single)[0])
except StopIteration as e:
pass
except IndexError as e:
pass
return selected_mp3_list
def create_target_file(y):
target = DIR_PATH / f"{y}_new"
if not os.path.exists(target):
os.makedirs(target)
return target
def copy_file_to_new_path(source, y, target):
"""
shutil复制文件
:return:
"""
try:
shutil.copy(source, target / source.name)
except Exception as e:
print(traceback.format_exc())
if __name__ == '__main__':
start = time.time()
year = "2000"
mp3_list = select_mp3(year)
target = create_target_file(year)
if target:
with ThreadPoolExecutor(max_workers=MAX_CONCCURENT) as pool:
pool.map(partial(copy_file_to_new_path, y=year, target=target), mp3_list)
print(f"并发{MAX_CONCCURENT}次,用时", time.time() - start)
#关于并发的问题有待观察。。。
# 线程池并发结果
# 并发2次,用时 6.518146991729736
# 并发10次,用时 7.732945919036865
# 并发30次,用时 7.956831932067871
# 并发100次,用时 7.956831932067871
# 进程池并发结果
# 并发2次,用时 6.013077974319458
# 并发8次,用时 6.863225221633911
# 并发14次,用时 4.6188788414001465
# 并发30次,用时 4.858534812927246
Python选择指定文件夹的文件然后复制出其中几个文件到新的文件夹的更多相关文章
- XCopy复制文件夹命令及参数详解以及xcopy拷贝目录并排除特定文件
XCOPY是COPY的扩展,可以把指定的目录连文件和目录结构一并拷贝,但不能拷贝系统文件:使用时源盘符.源目标路径名.源文件名至少指定一个:选用/S时对源目录下及其子目录下的所有文件进行COPY.除非 ...
- [转帖]XCopy复制文件夹命令及参数详解以及xcopy拷贝目录并排除特定文件
XCopy复制文件夹命令及参数详解以及xcopy拷贝目录并排除特定文件 https://www.cnblogs.com/smartsmile/p/7665979.html xcopy dirA dir ...
- Eclipse设置所有新创建文件默认格式为UTF-8
一.为什么需要设置所有新创建文件默认格式为UTF-8 Eclipse编码默认是ISO-8859-1,不支持中文.而很多时候,我们的文件中含有中文,或者需要在创建文件时就需要是UTF-8编码格式的.在创 ...
- zzw原创_根据某一文件复制出大量固定位数后缀名的递增的文件
1.trre.sh :根据某一文件复制出大量固定位数后后缀递增的文件. 如将 SPINFO_190516_20170109.001 复制成SPINFO_190516_20170109.002 ...
- Python压缩指定文件及文件夹为zip
Python压缩指定的文件及文件夹为.zip 代码: def zipDir(dirpath,outFullName): """ 压缩指定文件夹 :param dirpat ...
- Python——合并指定文件夹下的所有excel文件
前提:该文件夹下所有文件有表头且具有相同的表头. import glob # 同下 from numpy import * #请提前在CMD下安装完毕,pip install numppy impor ...
- python实现指定目录下批量文件的单词计数:并发版本
在 文章 <python实现指定目录下批量文件的单词计数:串行版本>中, 总体思路是: A. 一次性获取指定目录下的所有符合条件的文件 -> B. 一次性获取所有文件的所有文件行 - ...
- Python学习笔记(20)-文件和文件夹的移动、复制、删除、重命名
一,概述 python中对文件和文件夹进行移动.复制.删除.重命名,主要依赖os模块和shutil模块,要死记硬背这两个模块的方法还是比较困难的,可以用一个例子集中演示文件的移动.复制.删除.重命名, ...
- python 读取指定文件信息并拼接
python 读取指定文本并拼接成指定的格式 # -*- coding: utf-8 -*- import os def getHelloWorld(path, fileName): "&q ...
随机推荐
- eventFlow 系列 <二> 领域事件
看一个聚合根: public class ExampleAggregate : AggregateRoot<ExampleAggregate, ExampleId>, IEmit<E ...
- python计算出现错误
用python计算39.8-0.1得出的结果是39.699999999999996 其他数字计算正确,唯独这个计算错误. 原因: 中文解释: https://docs.python.org/zh-cn ...
- 多线程--volatile
在解释volatile关键字之前,先说说java的指令重排以及代码的执行顺序. 指令重排: public void sum(){ int x = 1; int y = 2; int x = x + 1 ...
- elasticsearch 数据备份
ES数据备份找了一些方法,发现elasticdump 这个工具不错 elasticdump --input=http://192.168.0.92:9200/hs2840 --output ./hs2 ...
- RabbitMQ消息分发轮询
一,前言 如果我们一个生产者,对应多个消费者,rabbitmq 会发生什么呢 二,消息分发轮询 前提条件:1个生产者 ----> 多个消费者,且no_ack=True (启动三次生产者) ① ...
- (备忘)Linux mount(挂载命令)详解
挂接命令(mount) 首先,介绍一下挂接(mount)命令的使用方法,mount命令参数非常多,这里主要讲一下今天我们要用到的. 命令格式:mount [-t vfstype] [-o option ...
- Centos7 docker、harbor 安装配置
Docker 安装 wget -O /etc/yum.repos.d/epel.repo http://mirrors.cloud.tencent.com/repo/epel-7.repo wget ...
- mysql中的分区
第18章:分区 目录 18.1. MySQL中的分区概述 18.2. 分区类型 18.2.1. RANGE分区 18.2.2. LIST分区 18.2.3. HASH分区 18.2.4. KEY分区 ...
- 百度人脸识别java html5
1.前端thymeleaf+h5 index.html 人脸识别+定位,用的百度sdk <!DOCTYPE html> <html xmlns="http://www ...
- golang 中Pointers Vs References
原文: https://spf13.com/post/go-pointers-vs-references/ Pointers Vs References Some languages includin ...