python使用多线程备份数据库

前言:在日常服务器运维工作中，备份数据库是必不可少的，刚工作那会看到公司都是用shell脚本循环备份数据库，到现在自己学习python语言后，利用多进程多线程相关技术来实现并行备份数据库，充分利用服务器资源，提高备份速度。

一、为什么要用线程池

1.多线程比单线程运行要快很多，比如在我工作中，每台服务器至少8个库以上，用单线程备份太慢了。

2.不是越多线程就会越好，而是根据服务器的资源来合理定义worker线程，否则会造成服务器严重负载，影响到线上业务。

3.备份数据库都是消耗IO操作，用多线程比多进程稍微会更有优势。

从Python3.2开始，标准库为我们提供了 concurrent.futures 模块，它提供了 ThreadPoolExecutor (线程池)和ProcessPoolExecutor (进程池)两个类。

相比 threading 等模块，该模块通过 submit 返回的是一个 future 对象，它是一个未来可期的对象，通过它可以获悉线程的状态主线程(或进程)中可以获取某一个线程(进程)执行的状态或者某一个任务执行的状态及返回值：

主线程可以获取某一个线程（或者任务的）的状态，以及返回值。

当一个线程完成的时候，主线程能够立即知道。

让多线程和多进程的编码接口一致。

二、线程池练习

演示例子1:使用submit方法

from concurrent.futures import ThreadPoolExecutor

import time

def test_thread(sec):

    time.sleep(sec)

    print(f"sleep {sec} done")

    return sec

with ThreadPoolExecutor(max_workers=4) as t:  # 创建一个最大容纳数量为4的线程池

    task1 = t.submit(test_thread, 1)

    task2 = t.submit(test_thread, 2)  # 通过submit提交执行的函数到线程池中

    task3 = t.submit(test_thread, 3)

    print(f"task1: {task1.done()}")  # 通过done来判断线程是否完成

    print(f"task2: {task2.done()}")

    print(f"task3: {task3.done()}")

    time.sleep(2.5)

    print(f"task1: {task1.done()}")

    print(f"task2: {task2.done()}")

    print(f"task3: {task3.done()}")

    print(task1.result())  # 通过result来获取返回值

结果输出:

task1: False

task2: False

task3: False

sleep 1 done

sleep 2 done

task1: True

task2: True

task3: False

1

sleep 3 done

使用 with 语句，通过 ThreadPoolExecutor 构造实例，同时传入 max_workers 参数来设置线程池中最多能同时运行的线程数目。

使用 submit 函数来提交线程需要执行的任务到线程池中，并返回该任务的句柄（类似于文件、画图），注意 submit() 不是阻塞的，而是立即返回。

通过使用 done() 方法判断该任务是否结束。上面的例子可以看出，提交任务后立即判断任务状态，显示3个任务都未完成。在延时2.5后，task1 和 task2 执行完毕，task3 仍在执行中。

演示例子2:使用map方法

import time

from concurrent.futures import ThreadPoolExecutor

def spider(page):

    time.sleep(page)

    return page

start = time.time()

executor = ThreadPoolExecutor(max_workers=4)

i = 1

for result in executor.map(spider, [2, 3, 1, 4]):

    print("task{}:{}".format(i, result))

    i += 1

结果输出:

task1:2

task2:3

task3:1

task4:4

from concurrent.futures import ThreadPoolExecutor有两种方式，一种是submit()函数，另一种是map()函数，两者的主要区别在于：

1.map可以保证输出的顺序, submit输出的顺序是乱的

2.如果你要提交的任务的函数是一样的，就可以简化成map。但是假如提交的任务函数是不一样的，或者执行的过程之可能出现异常（使用map执行过程中发现问题会直接抛出错误）就要用到submit()

3.submit和map的参数是不同的，submit每次都需要提交一个目标函数和对应的参数，map只需要提交一次目标函数，目标函数的参数放在一个迭代器（列表，字典）里就可以。

三、线上数据库测试

环境:centos6，数据库版本5.7，数据备份2个1.7G、一个800M、一个200M

第一种:shell脚本for的方式备份4个数据库

#!/bin/bash

backup_path="/data/backup/"

myuser="root"

mypwd="123456"

db_name="test_1000"

current_time=$(date +%Y%m%d%H%M%S)

for i in $(seq 4);do

    /usr/local/mysql/bin/mysqldump -u${myuser} -p${mypwd} --single-transaction --master-data=2 --set-gtid-purged=off "${db_name}${i}" | gzip > ${backup_path}/"${db_name}${i}"_${current_t

ime}.sql.gz

done

查看执行时间　　　　

mysqldump: [Warning] Using a password on the command line interface can be insecure.

mysqldump: [Warning] Using a password on the command line interface can be insecure.

mysqldump: [Warning] Using a password on the command line interface can be insecure.

mysqldump: [Warning] Using a password on the command line interface can be insecure.

real    4m28.421s

user    3m50.360s

sys     0m5.962s

第二种方式:多线程备份　　

可以明显看到优势

总结:在服务器上有需要备份多个数据库时，使用python多线程的方式比传统的shell脚本循环备份会更有优势，可以充分利用服务器上的资源，有效提升效率。

详细参考:

https://www.jianshu.com/p/6d6e4f745c27

https://www.cnblogs.com/zhang293/p/7954353.html

python使用多线程备份数据库的更多相关文章

Python 生产环境MySQL数据库增量备份脚本
MySQL数据库常用的办法是通过MySQLdump导出sql进行备份,但是不适合数据量很大的数据库,速度,锁表是两个严重的问题.前面写了一遍文章介绍xtrabackup的热备工具,见 http://w ...
MySQL数据库之多线程备份工具mydumper
Mydumper介绍: 1)Mydumper是一个针对MySQL和Drizzle的高性能多线程备份和恢复工具 2)特性: 轻量级C语言编写执行速度比mysqldump快10倍快速的文件压缩支持导 ...
python 多线程操作数据库
如果使用多线程操作数据库,容易引起多用户操作锁表 OperationalError: (2013, 'Lost connection to MySQL server during query') 使用 ...
实现定时备份mysql数据库并把备份数据库邮件发送
一.先来看备份mysql数据库的命令 1 mysqldump -u root --password=root --database abcDataBase > c:/abc_backup.sql ...
MySQL实验准备(二)--Python模拟数据(MySQL数据库)
Python模拟数据(MySQL数据库) 数据模拟目的:模拟多个表的插入和查询数据的模拟,再通过基准测试脚本测试服务器性能和收集数据,仿真模拟. 备注: 如果需要基础的python环境,可以查看&l ...
MySQL多线程备份工具mydumper
mydumper是一个针对MySQL和Drizzle的高性能多线程的备份和恢复工具.此工具的开发人员分别来自MySQL.Fackbook.SkySQL公司,目前已经有一些大型产品业务测试并使用了该工具 ...
MySQL多线程备份工具:mydumper
MySQL多线程备份工具:mydumper http://www.orczhou.com/index.php/2011/12/how-to-split-mysqldump-file/ Mydumper ...
Linux（CentOS7）设置自动备份数据库到阿里云OSS
环境:阿里云服务器CentOS7.4 + MySQL5.6 基本思路: 1.编写shell脚本,备份数据库到指定目录下 2.编写Python脚本,把文件上传到OSS 3.把shell脚本和Python ...
mysql多线程备份与还原工具mydumper
(一)mydumper介绍之前我们已经学过如何使用mysqldump备份恢复数据库:<mysql逻辑备份与还原工具mysqldump>,就目前来说,mysqldump是使用最广泛的MyS ...

随机推荐

Go-22-方法
方法 Go语言同时有函数和方法,方法的本质是函数,但是方法和函数又有所不同. 函数(function)是一段具有独立功能的代码,可以被反复多次调用,从而实现代码复用. 方法(method)是一个类的行 ...
Go-15-flag.String 获取系统参数
场景: 启动应用程序时,需要传入系统参数.例如:./start --b /notebook --p true --n 8 package main import ( "fmt" f ...
Maven相关知识总结
目录认识Maven Maven下载安装 Maven能用来做什么 Maven核心概念开发目录坐标和仓库 POM文件 POM文件内容 Maven依赖管理构建生命周期构建多模块系统聚合继承聚 ...
2.Python进程间的通信之队列（Queue）和生产者消费者模型
一.队列 1.1 概念介绍-----multiprocess.Queue 创建共享的进程队列,Queue是多进程安全的队列,可以使用Queue实现多进程之间的数据传递. Queue([maxsize] ...
JAVAEE_Servlet_12_获取前端页面请求方式 HttpServletRequest HttpServletResponse
获取前端页面请求方式 * 前端页面发送的请求方式应该是后端服务器需要的请求方式保持一致,若不一致应该提示错误信息. * 获取到前端的请求方式之后通过if语句进行判断, if("GET&quo ...
jinja2的简单使用
后端代码 from jinja2 import Template def index(): with open('./index.html', 'r', encoding='utf-8') as fp ...
spring data jpa之Auditing 表的创建时间，更新时间自动生成策略
java实际编程中,几乎每一张表都会有createTime和updateTime字段,spring的优秀之处在于只要用几个注解,就帮我们解决该类问题,具体实现: 1,实体类添加注解: @EntityL ...
SpringCloud之配置中心（config）的使用Git+数据库实现
SpringCloud微服务实战系列教程 -------------------------目录------------------------------ 一.配置中心应用(Git) 二.配置中心的 ...
hdu 3721 树的最小直径
题意: 给你一棵树,让你改变一条边,改变之后依然是一棵树,然后问你怎样改变才能让树的直径最短.这里的改变一条边指的是指把一条边长度不变,连在别的两个点上. 思路: 首先求出树的 ...
APP的编译和反编译
目录 Apktool的准备 Apktool解压APP Apktool打包APP 对APP进行签名

python使用多线程备份数据库

python使用多线程备份数据库的更多相关文章

随机推荐

热门专题