php zip文件内容比較类
php zip 文件比較类,比較两个zip文件的内容,返回新增,删除,及同样的文件列表。临时仅仅支持单层。
需求:上传一个zip文件,zip内有非常多图片文件。须要对图片文件进行一系列非常耗时的处理。当用户再更新zip文件时。推断zip内文件是否一致,仅仅处理不同的文件。这样可以节省资源与时间,因此须要编写一个可以比較zip内文件的类。
ZipCompare.class.php
<?php
/** Zip Compare class 比較两个zip文件的内容,返回新增,删除,及同样的文件列表,临时仅仅支持单层
* Date: 2014-05-18
* Author: fdipzone
* Ver: 1.0
*
* Func:
* public compare 比較zip文件内容
* private getInfo 获取zip内文件列表
* private parse 分析两个zip的文件内容
* private check 检查zip文件是否正确
* private check_handler 检查server是否有安装unzip
*/ class ZipCompare{ // class start /** 比較zip文件内容,列出不同样的部分
* @param String $zipfile1 zip文件1
* @param String $zipfile2 zip文件2
* @return Array
*/
public function compare($zipfile1, $zipfile2){ // 检查是否有安装unzip
if(!$this->check_handler()){
throw new Exception('unzip not install');
} // 检查zip文件
if(!$this->check($zipfile1) || !$this->check($zipfile2)){
throw new Exception('zipfile not exists or error');
} // 获取zip内文件列表
$zipinfo1 = $this->getInfo($zipfile1);
$zipinfo2 = $this->getInfo($zipfile2); // 分析两个zip的文件内容,返回同样及不同的文件列表
return $this->parse($zipinfo1, $zipinfo2); } /** 获取zip内文件列表
* @param String $zipfile zip文件
* @return Array zip内文件列表
*/
private function getInfo($zipfile){ // unzip -v fields
$fields = array('Length','Method','Size','Cmpr','Date','Time','CRC-32','Name'); // zip verbose
$verbose = shell_exec(sprintf("unzip -v %s | sed '\$d' | sed '\$d' | sed -n '4,\$p'", $zipfile)); // zip info
$zipinfo = array(); $filelist = explode("\n", $verbose); if($filelist){
foreach($filelist as $rowdata){
if($rowdata==''){
continue;
}
$rowdata = preg_replace('/[ ]{2,}/', ' ', $rowdata); // 将两个或以上空格替换为一个
$tmp = array_slice(explode(' ', $rowdata), 1); // 去掉第一个空格 $file = array_combine($fields, $tmp); $zipinfo[$file['Name']] = $file['Length'].'_'.$file['CRC-32']; // 文件名称,长度,CRC32,用于校验
}
} return $zipinfo; } /** 分析两个zip文件内容
* @param String $zipinfo1
* @param String $zipinfo2
* @return Array
*/
private function parse($zipinfo1, $zipinfo2){ $result = array(
'add' => array(), // 新增
'del' => array(), // 缺少
'match' => array() // 匹配
); if($zipinfo1 && $zipinfo2){ // 在zip1但不在zip2的文件
$result['add'] = array_values(array_diff(array_keys($zipinfo1), array_keys($zipinfo2))); // 在zip2但不在zip1的文件
$result['del'] = array_values(array_diff(array_keys($zipinfo2), array_keys($zipinfo1))); // 同一时候在zip1与zip2的文件
$match_file = array_values(array_diff(array_keys($zipinfo1), $result['add'])); // 检查同样文件名称的文件内容是否匹配
for($i=0,$len=count($match_file); $i<$len; $i++){ if($zipinfo1[$match_file[$i]]==$zipinfo2[$match_file[$i]]){ // match
array_push($result['match'], $match_file[$i]);
}else{ // not match, change to add
array_push($result['add'], $match_file[$i]);
} } } return $result; } /** 检查zip文件是否正确
* @param String $zipfile zip文件
* @return boolean
*/
private function check($zipfile){
// 文件存在且能解压
return file_exists($zipfile) && shell_exec(sprintf('unzip -v %s | wc -l', $zipfile))>1;
} /** 检查server是否有安装unzip
* @return boolean
*/
private function check_handler(){
return strstr(shell_exec('unzip -v'), 'version')!='';
} } // class end ?>
demo
<?php require "ZipCompare.class.php"; $obj = new ZipCompare();
$result = $obj->compare('test1.zip','test2.zip'); print_r($result); ?>
运行后输出:
Array
(
[add] => Array
(
[0] => 9.jpg
) [del] => Array
(
[0] => 5.jpg
[1] => 6.jpg
[2] => 7.jpg
[3] => 8.jpg
) [match] => Array
(
[0] => 1.jpg
[1] => 10.jpg
[2] => 11.jpg
[3] => 12.jpg
[4] => 13.jpg
[5] => 14.jpg
[6] => 15.jpg
[7] => 16.jpg
[8] => 17.jpg
[9] => 18.jpg
[10] => 2.jpg
[11] => 3.jpg
[12] => 4.jpg
) )
源代码下载地址:点击查看
php zip文件内容比較类的更多相关文章
- 011PHP文件处理——文件处理 文件内容分页操作类
<?php /** * 文件内容分页操作类: */ //访问地址:http://basicphp.com/006file/011.php?&page=1 class StrPage { ...
- 解决gvim 8.1中zip插件打开zip文件内容时,而文件路径带有空格的问题。
解决gvim 8.1中zip插件打开zip文件内容时,而文件路径带有空格的问题. 现象是只能打开一次,第二次打开就显示为空了. 通过 lcd切换工作目录.使得命令行操作中不再有带空格的路径 vim81 ...
- 读取Zip文件内容
第一步,上次文件并保存到服务器目录下 /// <summary> /// 上传压缩文件 /// </summary> protected void UploadZip() { ...
- zip文件解压工具类
java解压zip文件 import java.io.BufferedInputStream; import java.io.BufferedOutputStream; import java.io. ...
- Web API 自定义文件内容的定制类
public class FileContent : HttpContent { private readonly Stream _stream; public FileContent(string ...
- Java文件编码自动转换工具类(只改变编码,不会改变文件内容)
本篇随笔主要介绍了一个用java语言写的将一个文件编码转换为另一个编码并不改变文件内容的工具类: 通过读取源文件内容,用URLEncoding重新编码解码的方式实现. public class Cha ...
- 工具类_JavaPOI_Office文件内容读取
文件内容读取工具类,亲测可用 maven依赖: <dependency> <groupId>org.apache.poi</groupId> <artifac ...
- 【.NET深呼吸】Zip文件操作(1):创建和读取zip文档
.net的IO操作支持对zip文件的创建.读写和更新.使用起来也比较简单,.net的一向作风,东西都准备好了,至于如何使用,请看着办. 要对zip文件进行操作,主要用到以下三个类: 1.ZipFile ...
- 8.5 filecmp--文件和文件夹比較处理
本模块主要提供了对文件和文件夹进行简单的比較处理,假设须要复杂的文件比較须要使用difflib库来处理. filecmp.cmp(f1, f2, shallow=True) 比較文件f1和文件f2,当 ...
随机推荐
- [Word使用笔记]分类简介
什么Vistual Studio , Eclipse , Xcode , 都弱爆了,Word比他们难多了 - -! 此分类用于记录Word的一些使用
- [Android]获取设备相关信息
public static int screenWidth(Activity activity) { DisplayMetrics dm = new DisplayMetrics(); activit ...
- Mysql rr和rc隔离
REPEATABLE READ This is the default isolation level for InnoDB. For consistent reads, there is an im ...
- Linux共享wifi给Android手机
亲測可行,測试系统:Deepin2014,Ubuntu也一样.步骤很easy. 1.卸载hostapd,sudo apt-get remove hostapd(假设原来装过的话卸载,由于某些版本号不支 ...
- Computational Network Toolkit (CNTK) 是微软出品的开源深度学习工具包
Computational Network Toolkit (CNTK) 是微软出品的开源深度学习工具包 用 CNTK 搞深度学习 (一) 入门 Computational Network Toolk ...
- [置顶] think in java interview-高级开发人员面试宝典(七)
上两周研发任务太紧了,所以担搁了一下,我们继续我们的面试之旅. 下面是一个基于图书系统的15道SQL问答,供大家参考 问题描述:本题用到下面三个关系表:CARD 借书卡. CNO 卡号,N ...
- POj 1879 Tempus et mobilius Time and motion (模拟+群)
题目特别长,大意为球的传递. 三个轨道,一个库.各自是分钟单位的轨道.5min单位的轨道.一小时单位的轨道.还有就是n容量的库. 每过一分钟,一个小球从库里面出来,库符合先进先出,进入分钟轨道.假设分 ...
- ON、WHERE、HAVING的差别
ON .WHERE.HAVING都能通过限制条件筛选数据,但他们的使用及其不同.以下我们来分析三者之间的差别. 1. ON 和WHERE 全部的查询都回产生一个中间暂时报表,查询结果就是从 ...
- 为什么使用 React? Edit on GitHub
为什么使用 React? React 是一个 Facebook 和 Instagram 用来创建用户界面的 JavaScript 库.很人多认为 React 是 MVC 中的 V(视图). 我们创造 ...
- like-minded 都有什么意思_百度知道
like-minded 都有什么意思_百度知道 like-minded 都有什么意思