05文件合并脚本--By Mark Lutz

'''

合并split.py创建的目录下的所有组分文件以重建文件。

依赖文件名的排序：长度必须一致。

'''

import os,sys

readsize=1024

def join(fromdir,tofile):

    output=open(tofile,'wb')

    parts=os.listdir(fromdir)

    parts.sort()

    for filename in parts:

        filepath=os.path.join(fromdir,filename)

        fileobj=open(filepath,'rb')

        while True:

            filebytes=fileobj.read(readsize)

            if not filebytes:break

            output.write(filebytes)

        fileobj.close()

    output.close()

if __name__ == '__main__':

    if len(sys.argv)==2 and sys.argv[1]=='-help':

        print('Use:join.py [from-dir-name to-file-name]')

    else:

        if len(sys.argv)!=3:

            interactive=True

            fromdir=input('Directory containing part files?')

            tofile=input('Name of file to be recreated?')

        else:

            interactive=False

            fromdir,tofile=sys.argv[1:]

        absfrom,absto=map(os.path.abspath,[fromdir,tofile])

        print('Joining',absfrom,'to make',absto)

        try:

            join(fromdir,tofile)

        except:

            print('Error joinning files')

            print(sys.exc_info()[0],sys.exc_info()[1])

        else:

            print('Join complete:see',absto)

        if interactive:input('Press Enter key')

　　必要时，自己可能还要运行rar解压缩档案文件。

　　此脚本使用os.listdir目录下的所有组分文件，然后对文件名列表排序以便将各个组分文件按正确的顺序拼装回去。然后逐字节复制。

　　注意：

　　1、此脚本是在二进制模式下处理文件，每次读取1kb的小块。也可以将单个组分文件一次性地读入：output.write(open(filepath,'rb').read()) ,但这样的弊端是它真正将文件整个一次性载入内存了。

　　2、文件名排序：此方案依赖于组分文件目录中文件名的排序。它是对os.listdir返回的文件名调用了列表的sort方法，它隐式的要求创建分割文件时要有一致的长度和格式。为了满足这一要求，分割器在字符串格式化表达式中可采用零补齐数字的想法('part%04d')，以确保所有文件名在末尾的数字有着相同的位数（四位数）。排序时，较小数字前的字符零可确保组分文件正确排序并合并。或者，也可以把文件名中的数字抽出来，转换成int，然后通过列表sort方法的keys参数根据数值大小排序，

05文件合并脚本--By Mark Lutz的更多相关文章

AngularJS结合RequireJS做文件合并压缩的那些坑
我在项目使用了AngularJS框架,用RequireJS做异步模块加载(AMD),在做文件合并压缩时,遇到了一些坑,有些只是解决了,但不明白原因. 那些坑 1. build.js里面的paths必须 ...
Windows上的文件合并命令
从Linux转到Windowns后,发现很多好用的shell命令都没有了,但实际情况是Windows一样有DOS时代的命令窗口,在CLI年代用DOS的人也要干活. 比如,今天想将几个单独的sql文件整 ...
RequireJS对文件合并与压缩实现方法
RequireJS 是一个JavaScript模块加载器.它非常适合在浏览器中使用, 它非常适合在浏览器中使用,但它也可以用在其他脚本环境, 就像 Rhino and Node. 使用RequireJ ...
hive小文件合并设置参数
Hive的后端存储是HDFS,它对大文件的处理是非常高效的,如果合理配置文件系统的块大小,NameNode可以支持很大的数据量.但是在数据仓库中,越是上层的表其汇总程度就越高,数据量也就越小.而且这些 ...
hadoop 文件合并
来自:http://blog.csdn.net/dandingyy/article/details/7490046 众所周知,Hadoop对处理单个大文件比处理多个小文件更有效率,另外单个文件也非常占 ...
网络视频m3u8解密及ts文件合并
网络视频m3u8解密及ts文件合并参考了两篇博客: https://blog.csdn.net/weixin_41624645/article/details/95939510 https://bl ...
linux shell文件合并去重分割
1,合并+去重+分割转载:shell 文件合并,去重,分割 - kakaisgood - 博客园 (cnblogs.com) 第一:两个文件的交集,并集前提条件:每个文件中不得有重复行1. 取出两个 ...
CDN的combo技术能把多个资源文件合并引用，减少请求次数
CDN的combo技术能把多个资源文件合并引用,减少请求次数.比如淘宝的写法: <link rel="stylesheet" href="//g.alicdn.co ...
用于svn添加当前目录下所有未追踪的文件，和删除所有手动删除的文件的脚本
由于要经常用到类似与 git 中的 git add --all 这种操作,但是发现svn中并不支持类似的操作. 虽然可以使用 wildcard 进行匹配,但是 wildcard是在shell中进行匹配 ...

随机推荐

lnmp----------lnmp集成环境使用lnmp安装包安装lnmp集成环境的步骤
1.先看下screen -S lnmp 命令是否存在,不存在则安装.这个是个什么东东呢?百度一下( GNU Screen是一款由GNU计划开发的用于命令行终端切换的自由软件.用户可以通过该软件同时连接 ...
Python学习笔记之装饰器原理
def decorator(fn): def wrapper(): print("询价") fn() print("购买成功!") return wrapper ...
jQuery绑定事件方法及区别(bind,click,on,live,one)
第一种方式: ? 1 2 3 4 5 $(document).ready(function(){ $("#clickme").click(function(){ alert(& ...
html5-progress和meter用法
<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8&qu ...
如何注销Sitecore CMS
登录Sitecore很容易,但是在旧版本的Sitecore中使用不同的界面,退出可能会给未经证实的人带来挑战. Sitecore 8 Sitecore 6和7 Sitecore 8 Sitecore ...
Apache+Tomcat+Memcached实现会话保持
会话保持的三种方式 Session sticky会话绑定:通过在前端调度器的配置中实现统一session发送至同一后发端服务器 Session cluster会话集群:通过配置Tomcat保持所有To ...
Python学习记录之(五)-----类进阶篇
静态方法类方法属性方法通过@staticmethod装饰器即可把其装饰的方法变为一个静态方法,什么是静态方法呢?其实不难理解,普通的方法,可以在实例化后直接调用,并且在方法里可以通过self.调 ...
孤立森林(Isolation Forest)
前言随着机器学习近年来的流行,尤其是深度学习的火热.机器学习算法在很多领域的应用越来越普遍.最近,我在一家广告公司做广告点击反作弊算法研究工作.想到了异常检测算法,并且上网调研发现有一个算法非常火爆, ...
Sqoop 学习之路
sqoop 基础知识和基本操作可以参考这篇博客:https://www.cnblogs.com/qingyunzong/p/8807252.html#_label3
RocketMQ 顺序消费只消费一次坑
rocketMq实现顺序消费的原理 produce在发送消息的时候,把消息发到同一个队列(queue)中,消费者注册消息监听器为MessageListenerOrderly,这样就可以保证消费端只有一 ...

05文件合并脚本--By Mark Lutz

05文件合并脚本--By Mark Lutz的更多相关文章

随机推荐

热门专题