Python实现目录文件的全量和增量备份

目标：

　　1.传入3个参数:源文件路径，目标文件路径，md5文件

　　2.每周一实现全量备份，其余时间增量备份

1.通过传入的路径，获取该路径下面的所有目录和文件(递归)

方法一：使用os.listdir

代码如下：

#!/usr/bin/env python

#coding:utf8

import os,sys

def lsdir(folder):

    contents = os.listdir(folder)

    print "%s\n%s\n" % (folder, contents)

    for path in contents:

        full_path = os.path.join(folder, path)

        if os.path.isdir(full_path):

            lsdir(full_path)

if __name__ == "__main__":

    lsdir(sys.argv[1])

•运行代码，效果如下：

[root@localhost python]# python listdir.py /a

/a

['b', 'a.txt']

/a/b

['c', 'b.txt']

/a/b/c

['c.txt']

方法二：使用os.walk

代码如下：

#!/usr/bin/env python

# -*- coding: utf-8 -*-

import os,sys

def lsdir(folder):

   contents = os.walk(folder)

   for path, folder, file in contents:

       print "%s\n%s\n" %(path, folder + file)

if __name__ == "__main__":

    lsdir(sys.argv[1])

•运行代码，测试效果

[root@localhost python]# python listdir1.py /a

/a

['b', 'a.txt']

/a/b

['c', 'b.txt']

/a/b/c

['c.txt']

2.如何计算文件的md5值(每次读取4K，直到读取完文件所有内容，返回一个16进制的md5值)

代码如下：

[root@localhost python]# cat md5.py

#!/usr/bin/env python

# -*- coding: utf-8 -*-

import hashlib

import sys

def md5(fname):

    m = hashlib.md5()

    with open(fname) as fobj:

        while True:

            data = fobj.read(4096)

            if not data:

                break

            m.update(data)

    return m.hexdigest()

if __name__ == "__main__":

    print md5(sys.argv[1])

•运行代码，测试效果

[root@localhost python]# python md5.py a.txt

c33da92372e700f98b006dfa5325cf0d

[root@localhost python]# md5sum a.txt

c33da92372e700f98b006dfa5325cf0d  a.txt

*提示：使用linux自带的md5sum和自己编写的Python计算的md5值相通

3.编写全量和增量备份脚本

代码如下：

#!/usr/bin/env python

#coding:utf8

import time

import os

import tarfile

import cPickle as p

import hashlib

def md5check(fname):

    m = hashlib.md5()

    with open(fname) as fobj:

        while True:

            data = fobj.read(4096)

            if not data:

                break

            m.update(data)

    return m.hexdigest()

def full_backup(src_dir, dst_dir, md5file):

    par_dir, base_dir = os.path.split(src_dir.rstrip('/'))

    back_name = '%s_full_%s.tar.gz' % (base_dir, time.strftime('%Y%m%d'))

    full_name = os.path.join(dst_dir, back_name)

    md5dict = {}

    tar = tarfile.open(full_name, 'w:gz')

    tar.add(src_dir)

    tar.close()

    for path, folders, files in os.walk(src_dir):

        for fname in files:

            full_path = os.path.join(path, fname)

            md5dict[full_path] = md5check(full_path)

    with open(md5file, 'w') as fobj:

        p.dump(md5dict, fobj)

def incr_backup(src_dir, dst_dir, md5file):

    par_dir, base_dir = os.path.split(src_dir.rstrip('/'))

    back_name = '%s_incr_%s.tar.gz' % (base_dir, time.strftime('%Y%m%d'))

    full_name = os.path.join(dst_dir, back_name)

    md5new = {}

    for path, folders, files in os.walk(src_dir):

        for fname in files:

            full_path = os.path.join(path, fname)

            md5new[full_path] = md5check(full_path)

    with open(md5file) as fobj:

        md5old = p.load(fobj)

    with open(md5file, 'w') as fobj:

        p.dump(md5new, fobj)

    tar = tarfile.open(full_name, 'w:gz')

    for key in md5new:

        if md5old.get(key) != md5new[key]:

            tar.add(key)

    tar.close()

if __name__ == '__main__':

    src_dir = '/Users/xkops/gxb/'

    dst_dir = '/tmp/'

    md5file = '/Users/xkops/md5.data'

    if time.strftime('%a') == 'Mon':

        full_backup(src_dir, dst_dir, md5file)

    else:

        incr_backup(src_dir, dst_dir, md5file)

•运行代码，测试效果(执行前，修改需要备份的文件和路径)，运行之后检查/tmp下是否生成了当天的备份文件。

Python实现目录文件的全量和增量备份的更多相关文章

python实现对文件的全量、增量备份
#!/user/bin/env python # @Time :2018/6/6 10:10 # @Author :PGIDYSQ #@File :FileBackup2.py import os i ...
MySQL5.7.18 备份、Mysqldump，mysqlpump，xtrabackup，innobackupex 全量，增量备份，数据导入导出
粗略介绍冷备,热备,温暖,及Mysqldump,mysqlpump,xtrabackup,innobackupex 全量,增量备份 --备份的目的灾难恢复:意外情况下(如服务器宕机.磁盘损坏等)对损 ...
mysql全量和增量备份详解（带脚本）
在日常运维工作中,对mysql数据库的备份是万分重要的,以防在数据库表丢失或损坏情况出现,可以及时恢复数据. 下面对这种备份方案详细说明下:1.MySQLdump增量备份配置执行增量备份的前提条件是M ...
oracle全量、增量备份
采用0221222增量备份策略,7天一个轮回也就是周日0级备份,周1 2 4 5 6 采用2级增量备份,周3采用1级增量备份打开控制文件自动备份 CONFIGURE CONTROLFILE AUT ...
innobackupex在线备份及恢复（全量和增量）
Xtrabackup是由percona开发的一个开源软件,它是innodb热备工具ibbackup(收费的商业软件)的一个开源替代品.Xtrabackup由个部分组成:xtrabackup和innob ...
关于Subversion主从备份方式的调整（全量、增量脚本）更新
本文引用于http://blog.chinaunix.net/uid-25266990-id-3369172.html 之前对Subversion服务器作了迁移,关于SVN的架构也走了调整,有单一的服 ...
Mysql备份工具xtraback全量和增量测试
Mysql备份工具xtraback全量和增量测试 xtrabackup 是 percona 的一个开源项目,可以热备份innodb ,XtraDB,和MyISAM(会锁表) 官方网址http:// ...
MySQL数据以全量和增量方式，同步到ES搜索引擎
本文源码:GitHub·点这里 || GitEE·点这里一.配置详解场景描述:MySQL数据表以全量和增量的方式向ElasticSearch搜索引擎同步. 1.下载内容 elasticsearch ...
全量、增量数据在HBase迁移的多种技巧实践
作者经历了多次基于HBase实现全量与增量数据的迁移测试,总结了在使用HBase进行数据迁移的多种实践,本文针对全量与增量数据迁移的场景不同,提供了1+2的技巧分享. HBase全量与增量数据迁移的方 ...

随机推荐

c/c++程序设计涉及的一些知识点
c/c++程序设计涉及的一些知识点 c中的printf函数 main(){ int b = 3; int arr[]= {6,7,8,9,10}; int * ptr = arr; *(ptr++) ...
python3 内存管理
怎么查找哪里存在内存泄露呢?武器就是两个库:gc.objgraph pip install psutil pip install objgraphpip install -U memory_profi ...
Excel不同工作簿之间提取信息
Sub 不同工作簿间提取信息() '用于单个字段信息的提取: Dim w As Workbook, wb1 As Workbook, wb2 As Workbook, wb3 As Workbook ...
Nginx+jwPlay搭建流媒体服务器，记忆播放
1.具体的流媒体服务器的搭建参考博客: http://blog.chinaunix.net/uid-20639775-id-154556.html 具体可能编译的时候有个地方报错 /root/ngin ...
20165226 实验三敏捷开发与XP实践
实验三敏捷开发与XP实践实验目的一.安装alibaba 插件,解决代码中的规范问题.在IDEA中使用工具(Code->Reformate Code)格式化代码,研究一下Code菜单,比较功 ...
hsqldb简单使用总结
hsqldb数据库是一款纯Java实现的开源免费数据库,相对其他数据库来说,体积非常小,使用方便,非常利于在测试环境中使用,无需复杂的数据库配置. hsqldb数据库引擎有几种服务器模式:Se ...
导出文件名带时间信息的dmp文件
exp system/orcl@orcl owner=aixm file=d:\aixm%date:~0,4%%date:~5,2%%date:~8,2%_%time:~0,2%%time:~3,2% ...
【转】Android编码规范建议18条
转自:http://www.chinaz.com/design/2015/0908/443732.shtml Android编码规范建议18条适合手机app设计师和android 工程师阅读. 1. ...
HTTP与TCP/IP的区别
TPC/IP协议是传输层协议,主要解决数据如何在网络中传输,而HTTP是应用层协议,主要解决如何包装数据.关于TCP/IP和HTTP协议的关系,网络有一段比较容易理解的介绍:“我们在传输数据时,可以只 ...
python中django的第一课
今天找遍了,PYTHON项目中的文件,也没发现后台管理的这些页面去哪里修改原来在pycharm中的外部库中,查找django,最终找到 $python\django\django\contrib\a ...

Python实现目录文件的全量和增量备份

Python实现目录文件的全量和增量备份的更多相关文章

随机推荐

热门专题