背景:我在5月20日收到了一批Excel文件数据,由于文件很多大约有将近5000个,已经通过编写python脚本处理完成.但是6月9日的时候,又收到了一批新的Excel数据.但是在处理过程中发现,本次提供的数据包含5月20日提供的数据.有的是新增了几个文件,但是文件后缀加了1.2.3这样的数字,有的直接在原先的文件中插入了新的记录,为了对比出来,我编写了一个脚本用来对比文件是否变化. 判断逻辑:如果文件前缀一样,只是后面的数字不一样,就根据文件大小判断.如果大小一致,就认为是旧文件,反之是新增文