zip 文件上的校验和


checksums on zip files

我目前正在开发一种上传一组文件的工具,然后使用 md5 校验和将文件与上传的最后一批文件进行比较,并告诉您哪些文件发生了更改。

对于常规文件,这工作正常,但一些上传的文件是zip存档,即使其中的文件相同,它们几乎总是会更改。

有没有办法执行不同类型的校验和来检查这些文件是否已更改,而无需单独解压缩每个文件,然后单独比较每个文件的内容。

这是我目前的函数

function check_if_changed($date, $folder, $filename)
{
  $dh = opendir('./wp-content/uploads/Base/');
  while (($file = readdir($dh)) !== false) {
    $folders[] = $file;
  }
  sort($folders);
  $position = array_search($date, $folders);
  $prev_folder = $folders[$position - 1];
  if ($prev_folder == '.' || $prev_folder == '..')
    { return true;}
  $newhash = md5_file('./wp-content/uploads/Base/'.$date.'/'.$folder.'/'.$filename);
  $oldhash = md5_file('./wp-content/uploads/Base/'.$prev_folder.'/'.$folder.'/'.$filename);
  if ($oldhash != $newhash){
    return true;
  }
  return false;
}

在zip存档中,每个"文件"都存储有元数据,如上次修改时间,文件名,以字节为单位的文件大小等。和重要的部分 - CRC32校验和

基本上,您可以以二进制方式对zip存档进行操作,找到每个文件的元数据标头,并将校验和与以前存储的校验和进行比较。您无需执行任何解压缩即可访问 zip 存档中的元数据。这将非常快。

http://en.wikipedia.org/wiki/Zip_(file_format(

编辑 - 实际上,ZipArchive提供了此功能。看:http://www.php.net/manual/en/ziparchive.statindex.php

您可以只提取 ZIP 文件的文件部分,然后对其进行哈希处理,但随后您也必须删除元信息!

因此,提取文件实际上是最简单的解决方案。