我目前正在开发一种上传一组文件的工具,然后使用 md5 校验和将文件与上传的最后一批文件进行比较,并告诉您哪些文件发生了更改。
对于常规文件,这工作正常,但一些上传的文件是zip存档,即使其中的文件相同,它们几乎总是会更改。
有没有办法执行不同类型的校验和来检查这些文件是否已更改,而无需单独解压缩每个文件,然后单独比较每个文件的内容。
这是我目前的函数
function check_if_changed($date, $folder, $filename)
{
$dh = opendir('./wp-content/uploads/Base/');
while (($file = readdir($dh)) !== false) {
$folders[] = $file;
}
sort($folders);
$position = array_search($date, $folders);
$prev_folder = $folders[$position - 1];
if ($prev_folder == '.' || $prev_folder == '..')
{ return true;}
$newhash = md5_file('./wp-content/uploads/Base/'.$date.'/'.$folder.'/'.$filename);
$oldhash = md5_file('./wp-content/uploads/Base/'.$prev_folder.'/'.$folder.'/'.$filename);
if ($oldhash != $newhash){
return true;
}
return false;
}
在zip存档中,每个"文件"都存储有元数据,如上次修改时间,文件名,以字节为单位的文件大小等。和重要的部分 - CRC32校验和。
基本上,您可以以二进制方式对zip存档进行操作,找到每个文件的元数据标头,并将校验和与以前存储的校验和进行比较。您无需执行任何解压缩即可访问 zip 存档中的元数据。这将非常快。
http://en.wikipedia.org/wiki/Zip_(file_format(
编辑 - 实际上,ZipArchive提供了此功能。看:http://www.php.net/manual/en/ziparchive.statindex.php
您可以只提取 ZIP 文件的文件部分,然后对其进行哈希处理,但随后您也必须删除元信息!
因此,提取文件实际上是最简单的解决方案。