需求:

  编写一个diff工具,用于判断两个目录下所有的改动

详细介绍:

  1. 有A和B两个目录,目录所在位置及层级均不确定
  2. 需要以B为基准找出两个目录中所有有改动的文件(文件或内容增加、修改、删除),将有改动的文件放入第三个目录中,层级结构与原目录相同
  3. 将所有新增与更新信息记录到更新日志文件中
  4. 将删除信息单独记录到删除日志文件中
  5. 每次执行diff工具需要生成一个新的以日期命名的目录存放文件

使用场景:

  本工具用于软件版本升级时找出两个版本间所有修改过的文件,便于增量替换。

提示:    使用CRC判断文件是否改动

依赖的Jar包:

代码如下:

package test2;

import java.io.File;
import java.io.IOException;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.Date;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import org.apache.commons.io.FileUtils;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory; public class DiffUtil { private static Logger logger = LoggerFactory.getLogger(DiffUtil.class);// slf4j的日志记录器 /**
* 对比文件
* @param oldDir 旧版本文件(需求中的A文件夹)
* @param nowDir 新版本文件(需求中的B文件夹)
* @param diffDir 生成对比结果的文件夹(需求中的change文件夹)
*/
public static void compareFile(String oldDir, String nowDir, String diffDir) {
long startTime = System.currentTimeMillis();// 开始时间
// 1.在change文件夹下面生成一个当前日期格式的文件夹
String currentTime = convertCurrentTime2String();
String fileAndLogDir = diffDir + "\\" + currentTime;// 存放日志和更新后的文件的目录
File fileDiffDir = new File(fileAndLogDir);
fileDiffDir.mkdirs(); // 2.获取旧版本文件夹下和新版本文件夹下面的文件的CRC校验码
Map<String, Long> oldFileCRCs = getAllFileNameAndCRC(oldDir, oldDir,
new HashMap<String, Long>());
Map<String, Long> nowFileCRCs = getAllFileNameAndCRC(nowDir, nowDir,
new HashMap<String, Long>()); // 3.遍历删除的文件且将日志信息输出到deleteFile.log
String deleteLogName = "deleteFile.log";
File deleteLogFile = new File(fileDiffDir, deleteLogName);
// 3.1遍历旧文件夹下面的map的key,如果在新文件夹的map中找不到匹配的key值,证明是删除文件了
logger.info("----开始记录删除日志:" + convertCurrentTime2String() + "----");
try {
FileUtils.write(deleteLogFile, "-----开始记录删除日志:"
+ convertCurrentTime2String() + "----\r\n", "UTF-8", true);
} catch (IOException e) {
logger.error("将删除日志写入文件deteFile.log出错", e);
} List<String> deleteFileNames = new ArrayList<String>();
for (String oldKey : oldFileCRCs.keySet()) {
if (!nowFileCRCs.containsKey(oldKey)) {
logger.info("删除文件\t" + oldKey);
try {
FileUtils.write(deleteLogFile, "删除文件\t" + oldKey + "\r\n",
"UTF-8", true);
} catch (IOException e) {
logger.error("将删除日志写入文件deteFile.log出错", e);
}
deleteFileNames.add(oldKey);
}
} try {
FileUtils.write(deleteLogFile, "\r\n", "UTF-8", true);
FileUtils.write(deleteLogFile, "---------删除文件日志结束:共删除"
+ deleteFileNames.size() + "个文件----" + "\r\n", "UTF-8",
true);
} catch (IOException e) {
logger.error("将删除日志的统计信息写入文件deteFile.log出错", e);
}
logger.info("-----删除文件日志结束:共删除" + deleteFileNames.size() + "个文件----"); // 4.遍历增加和更新的文件
String addAndUpdateLogName = "addAndUpdate.log";
File addUpdateLogFile = new File(fileDiffDir, addAndUpdateLogName);
logger.info("-----开始记录增加、更新日志------");
List<String> addFileNames = new ArrayList<String>();// 增加文件名字集合
List<String> updateFileNames = new ArrayList<String>();// 更新文件名字集合
for (String nowKey : nowFileCRCs.keySet()) {
if (!oldFileCRCs.containsKey(nowKey)) {
addFileNames.add(nowKey);
} else {
if (oldFileCRCs.get(nowKey).equals(nowFileCRCs.get(nowKey))) {
continue;
}
updateFileNames.add(nowKey);
}
} // 4.1新增文件写入日志
try {
FileUtils.write(addUpdateLogFile, "-----Diff时间:"
+ convertCurrentTime2String() + "----" + "\r\n", "UTF-8",
true);
FileUtils.write(addUpdateLogFile, "\r\n", "UTF-8", true);
FileUtils.write(addUpdateLogFile, "----共新增文件" + addFileNames.size()
+ "个----\r\n", "UTF-8", true);
logger.info("----共新增文件" + addFileNames.size() + "个----");
} catch (IOException e1) {
logger.error("将新增信息写入文件addAndUpdate.log出错", e1);
} for (String addFileName : addFileNames) {
try {
logger.info("增加了文件" + addFileName);
FileUtils.write(addUpdateLogFile, "增加了文件" + addFileName
+ "\r\n", "UTF-8", true);
} catch (IOException e) {
logger.error("将新增信息写入文件addAndUpdate.log出错", e);
}
} // 4.2更新信息写入日志
try {
FileUtils.write(addUpdateLogFile, "\r\n", "UTF-8", true);
FileUtils.write(addUpdateLogFile,
"----共更新文件" + updateFileNames.size() + "个----\r\n",
"UTF-8", true);
logger.info("----共更新文件" + updateFileNames.size() + "个----");
} catch (IOException e) {
logger.error("将更新信息写入文件addAndUpdate.log出错", e);
}
for (String updateFileName : updateFileNames) {
try {
FileUtils.write(addUpdateLogFile, "更新了文件" + updateFileName
+ "\r\n", "UTF-8", true);
logger.info("更新了文件" + updateFileName);
} catch (IOException e) {
logger.error("将更新信息写入文件addAndUpdate.log出错", e);
}
}
// 5.将有新增/更新的文件放入第三个目录中(文件拷贝)
filesCopy(addFileNames, nowDir, diffDir + "\\"+ currentTime);
filesCopy(updateFileNames, nowDir, diffDir + "\\"+ currentTime);
long endTime = System.currentTimeMillis();// 结束时间
logger.info("----运行结束,耗时" + (endTime - startTime) + "ms----");
// 6.写入程序运行时间到日志文件
try {
FileUtils.write(addUpdateLogFile, "----运行结束,耗时"
+ (endTime - startTime) + "ms----" + "\r\n", "UTF-8", true);
FileUtils.write(deleteLogFile, "----运行结束,耗时"
+ (endTime - startTime) + "ms----" + "\r\n", "UTF-8", true);
} catch (IOException e) {
logger.error("将运行耗时写入日志文件出错", e);
}
} /**
* 将新增的文件和更新的文件复制到第三个文件夹(开源jar包实现文件拷贝)
* @param fileNames 文件名字集合
* @param nowDir 当前所在的目录
* @param diffDir 目的目录
*/
private static void filesCopy(List<String> fileNames,
String nowDir, String diffDir) {
File srcFile = null,destFile = null , destFileDir = null;
for (String sourceFileName : fileNames) {
srcFile = new File(nowDir+"\\"+sourceFileName);
destFile = new File(diffDir, sourceFileName);
String fileName = srcFile.getName();
destFileDir = new File((diffDir + "\\" + sourceFileName).replace(
fileName, ""));
destFileDir.mkdirs();
try {
FileUtils.copyFile(srcFile, destFile);
} catch (IOException e) {
logger.error("复制文件出错",e);
}
}
} /**
* 获取指定文件夹下面的所有文件,key是文件的名字(去掉基层路径),value是CRC冗余检验码(递归遍历)
* @param baseDir 基层路径
* @param fileDir 真实文件名字(去掉基层路径形成key)
* @param resultMap 结果(所有文件的CRC32码,key是真实文件名去掉基层路径,Value是CRC32码)
* @return 所有文件的CRC32码,key是真实文件名去掉基层路径,Value是CRC32码
*/
private static Map<String, Long> getAllFileNameAndCRC(String baseDir,
String fileDir, Map<String, Long> resultMap) {
File file = new File(fileDir);
if (!file.exists()) {// 文件不存在直接返回
return null;
} if (file.isDirectory()) {// 如果是目录,继续递归遍历获取其下面的所有文件的CRC32码
for (File f : file.listFiles()) {
getAllFileNameAndCRC(baseDir, f.getAbsolutePath(), resultMap);
}
} else {// 如果是文件,获取文件的CRC32码并添加到map中
long fileCRC = 0l;
try {
fileCRC = FileUtils.checksumCRC32(file);
} catch (IOException e) {
logger.error("获取文件的CRC32出错",e);
}
resultMap.put(file.getAbsolutePath().replace(baseDir, ""), fileCRC);
} return resultMap;
} /**
* 将当前日期转换为指定格式的字符串
* @return yyyy年MM月dd日HH时mm分ss秒 格式的日期串
*/
private static String convertCurrentTime2String() {
SimpleDateFormat sdf = new SimpleDateFormat("yyyy年MM月dd日HH时mm分ss秒");
return sdf.format(new Date());
} }

测试:

package test2;

public class MyTest {

    public static void main(String[] args) {
// 1.第一种测试方式,直接将需要对比的文件夹写死在程序中运行
String oldDir = "C:\\Users\\Administrator\\Desktop\\mytest\\A";
String nowDir = "C:\\Users\\Administrator\\Desktop\\mytest\\B";
String diffDir = "C:\\Users\\Administrator\\Desktop\\mytest\\change"; //第二种方式,cmd窗口传参数进行运行
/*if (args == null || args.length != 3) {
System.out
.println("参数不全,使用方式java -jar DiffUtils.jar 原路径名 新路径名 diff目录路径");
return;
}
String oldDir = args[0];
String nowDir = args[1];
String diffDir = args[2];*/
DiffUtil.compareFile(oldDir, nowDir, diffDir);
} }

我已经将此工具作为一个jar包打包起来,下载地址: http://qiaoliqiang.cn/fileDown/DiffUtil.jar

运行方式:

java -jar DiffUtil.jar C:\Users\liqiang\Desktop\新建文件件夹\考核1 C:\Users\liqiang\Desktop\新建文件夹\change

 总结:

  1. 文件复制有多种方式,可以用    FileUtils.copyFile(srcFile, destFile);  只需要传递两个File参数,第一个是源文件,第二个是目的文件。

              也可以用   IOUtils.copy(inputStream, outputStream);  传递两个参数,第一个输入流,第二个是输出流。

  2.  获取文件的CRC32循环冗余检验码也有多种方式,可以直接用   FileUtils.checksumCRC32(file);   直接获取

                          也可以用下面的工具方法获取:

/**
* 获取文件的CRC
*
* @param file
* 需要获取CRC32码的文件
* @return 文件的CRC32循环冗余码
*/
private static long getFileCRC(File file) {
BufferedInputStream bsrc = null;
CRC32 crc = new CRC32();
try {
bsrc = new BufferedInputStream(new FileInputStream(file));
byte[] bytes = new byte[1024];
int i;
while ((i = bsrc.read(bytes)) != -1) {
crc.update(bytes, 0, i);
}
} catch (Exception e) {
logger.error("计算文件的CRC32循环冗余检验出错", e);
} finally {
if (bsrc != null) {
try {
bsrc.close();
} catch (IOException e) {
logger.error("计算文件的CRC32循环冗余检验出错", e);
}
}
}
return crc.getValue();
}

  3.日志记录也有多种方法,第一种使用log4j,获取logger的方法如下:   Logger logger = Logger.getLogger(ApArrangeCourseAuditController.class);

              第二种使用slf4j,获取logger的方法如下:    private Logger logger = LoggerFactory.getLogger(ExtUserController.class);

一个diff工具,用于判断两个目录下所有的改动(比较新旧版本文件夹)的更多相关文章

  1. 代码实现:判断E盘目录下是否有后缀名为.jpg的文件,如果有,就输出该文件名称

    package com.loaderman.test; import java.io.File; import java.io.FilenameFilter; public class Test { ...

  2. Shell 实现找出两个目录下的同名文件方法

    # 首先我们来创建一些 2 个目录,里面的目录结构及相关文件如下所示: # 从上面的测试目录可以看到, lol.txt lol2.txt 两个文件是两个目录下的同名文件 # 有实际例子,思路就容易出来 ...

  3. [No00006B]方便的网络下载工具wget 可下载网站目录下的所有文件(可下载整个网站)

    wget是linux下命令行的下载工具,功能很强大,它能完成某些下载软件所不能做的,比如如果你想下载一个网页目录下的所有文件,如何做呢?网络用户有时候会遇到需要下载一批文件的情况,有时甚至需要把整个网 ...

  4. linux中/etc与/var目录,各是什么意思?这两个目录下的文件有什么特点?

    http://zhidao.baidu.com/link?url=DkxU9CyhJb_dIUAPCmPmxRtQsENgCzqy5qnLPEj_V9DqNzdt6Qya0U5iCVRCYFkgoRo ...

  5. 文件名命工具类(将指定目录下的文件的type类型的文件,进行重命名,命名后的文件将去掉type)

    import java.io.File; /** * <b>function:</b> 文件命名工具类 * @author hoojo * @createDate 2012-5 ...

  6. 用Python删除本地目录下某一时间点之前创建的所有文件

    因为工作原因,需要定期清理某个文件夹下面创建时间超过1年的所有文件,所以今天集中学习了一下Python对于本地文件及文件夹的操作.网上 这篇文章 简明扼要地整理出最常见的os方法,抄袭如下: os.l ...

  7. 2.每人自己建立一个HelloWorld项目,练习使用git的add/commit/push/pull/fetch/clone等基本命令。比较项目的新旧版本的差别。答题人:张立鹏

    第1步:创建SSH Key.在用户主目录下,看看有没有.ssh目录,如果有,再看看这个目录下有没有id_rsa和id_rsa.pub这两个文件,如果已经有了,可直接跳到下一步.如果没有,打开Shell ...

  8. 第二章——建立一个HelloWorld项目,练习使用git的add/commit/push/pull/fetch/clone等基本命令。比较项目的新旧版本的差别-----答题者:徐潇瑞

    1.首先下载安装git,很简单所以就不详细说了,当弹出一个类似的命令窗口的东西,就说明Git安装成功 2.因为Git是分布式版本控制系统,所以需要填写用户名和邮箱作为一个标识 3.接着,注册githu ...

  9. Pycharm学习记录---同一目录下无法import明明已经存在的.py文件

    转自:https://blog.csdn.net/l8947943/article/details/79874180 问题描述: 如图:同目录下明明存在相应文件,在导入时却出现带有红色波浪线,说没有相 ...

随机推荐

  1. Avito Cool Challenge 2018 自闭记

    A:n==2?2:1. #include<iostream> #include<cstdio> #include<cmath> #include<cstdli ...

  2. 使用cmstp绕过应用程序白名单

    默认情况下,AppLocker允许在文件夹中执行二进制文件,这是可以绕过它的主要原因.已经发现,这样的二进制文件可以很容易地用于绕过AppLocker和UAC.与Microsoft相关的二进制文件之一 ...

  3. LINUX内核分析第七周——可执行程序的装载

    一.得到一个可执行程序 1. 预处理.编译.链接 gcc hello.c -o hello.exe gcc编译源代码生成最终可执行的二进制程序,GCC后台隐含执行了四个阶段步骤. 预处理 => ...

  4. bzoj 1539: [POI2005]Dwu-Double-row

    假设一列交换表示为1,不换表示为0. 身高相同的两个人相当于给其中两列了一个限制条件,要么是两个必须相等,要么一个为零一个为一. 有了关系后我们就可以把每列当成一个点建边,边权为0表示必须相同,1为必 ...

  5. 【codeforces gym】Increasing Costs

    Portal --> Increasing Costs Description 给你一个\(n\)个点无重边无自环的无向连通图,每条边有一个边权,对于每一条边,询问去掉这条边之后有多少个点到\( ...

  6. 【数学/贪心/DP】【CF1088E】 Ehab and a component choosing problem

    Description 给定一棵 \(n\) 个节点的树,点有点权 \(a_u\),可能为负.现在请你在树上找出 \(k~(1~\leq~k~\leq~n)\) 个不相交集合,使得每个集合中的每对点都 ...

  7. E. Mahmoud and Ehab and the function Codeforces Round #435 (Div. 2)

    http://codeforces.com/contest/862/problem/E 二分答案 一个数与数组中的哪个数最接近: 先对数组中的数排序,然后lower_bound #include &l ...

  8. 五、Linux学习之文件搜索命令

    一.文件搜索命令locate locate 文件名 在后台数据库中按文件名搜索,搜索速度最快 /var/lib/mlocate #locate命令所搜索的后台数据库(数据库不会实时刷新,所以新建的文件 ...

  9. 同一个局域网中用Windows自己的远程桌面远程局域网中的其他PC

    同一个局域网中用Windows自己的远程桌面远程局域网中的其他PC... ===================== 建立Windows远程访问的前提: 1.访问PC和被访问的PC在同一个局域网中 2 ...

  10. Go_20: Golang 中 time 包的使用

    time包中包括两类时间:时间点(某一时刻)和时常(某一段时间) 1. 时间常量(时间格式化) const ( ANSIC = "Mon Jan _2 15:04:05 2006" ...