修改后的PHP MD5提供了不同的散列


Modified PHP MD5 gives different hashes

我在PHP和VB.NET中使用了一个经过修改的MD5哈希函数。当我在本地服务器(WAMP)上运行PHP代码时,我会得到与VB版本不同的结果。我试过在phpfiddle上运行这个脚本,它给出了与VB版本相同的结果。

我想问题可能出在WAMP服务器上的PHP设置上?

如果我在运行WAMP的电脑上运行下面的脚本,我得到的结果是:

e5c35f7c3dea80fc68a031582f34c25

当我在phpfiddle或php沙箱上运行完全相同的脚本时,我得到的结果是(这是预期的结果):

6337a43e8cd36058e80ae8cb4f465998

暂时抛开你在这里所做的听起来像是一种糟糕的方法这一事实,不管你试图解决的实际问题是什么,这里是这个问题的直接答案。


正如我在上面的一条评论中所概述的,您遇到的问题的根本原因是PHP没有无符号整数的概念,它通过将溢出整数边界的数字转换为浮点来处理这一问题(这在逐位操作中不太好)。这意味着,在32位系统上,您的代码将无法正常工作,因为MD5适用于无符号的32位整数。

您需要确保您的代码是"二进制安全的",这样所有数字都可以表示为无符号32位整数。

要做到这一点,您需要重新实现加法运算符,以及(使用当前实现)bindec()/hexdec()函数。值得注意的是,您当前处理某些过程的方法效率非常低-所有这些转换为十六进制字符串或从十六进制字符串转换为二进制字符串的地方-但在向您展示如何快速修复当前实现时,我将暂时忽略这一点。

首先让我们来看看添加操作:

private function binarySafeAddition($a, $b)
{
    // NB: we don't actually need 64 bits, theoretically we only need 33
    // but 40 bit integers are confusing enough, and 33 bits is unrepresentable
    $a = "'x00'x00'x00'x00" . pack('N', $a);
    $b = "'x00'x00'x00'x00" . pack('N', $b);
    $carry = $a & $b;
    $result = $a ^ $b;
    while ($carry != "'x00'x00'x00'x00'x00'x00'x00'x00") {
        $shiftedcarry = $this->leftShiftByOne($carry);
        $carry = $result & $shiftedcarry;
        $result ^= $shiftedcarry;
    }
    return current(unpack('N', substr($result, 4)));
}
private function leftShiftByOne($intAsStr)
{
    $p = unpack('N2', $intAsStr);
    return pack('N2', ($p[1] << 1) | (($p[2] >> 31) & 0x00000001), $p[2] << 1);
}
private function add()
{
    $result = 0;
    foreach (func_get_args() as $i => $int) {
        $result = $this->binarySafeAddition($result, $int);
    }
    return $result;
}

这种套路的真正细节是从这里无耻地偷走的。还有一个帮助函数来执行左移,因为PHP不允许您左移字符串,还有一个方便的包装函数,允许我们在一个干净的调用中将任意数量的操作数添加在一起。

接下来让我们看看bindec()hexdec()的替代品:

private function binarySafeBinDec($bin)
{
    $bits = array_reverse(str_split($bin, 1));
    $result = 0;
    foreach ($bits as $position => $bit) {
        $result |= ((int) $bit) << $position;
    }
    return $result;
}
private function binarySafeHexDec($hex)
{
    $h = str_split(substr(str_pad($hex, 8, '0', STR_PAD_LEFT), -8), 2);
    return (hexdec($h[0]) << 24) | (hexdec($h[1]) << 16) | (hexdec($h[2]) << 8) | hexdec($h[3]);
}

希望这些都是合理的不言自明,但如果你不理解,可以随意询问。

我们还需要用二进制安全实现替换所有这些0xffffffff十六进制文字,因为这些也会导致32位系统上的浮点运算。这里有一种安全的方法来获得整数中最多32位的正确设置,它将在32位和64位系统上工作:

private $right32;
public function __construct()
{
    $this->right32 = ~((~0 << 16) << 16);
}

还有一种方法需要重新实现,那就是rotate()。这是因为它使用了右移,这会将符号位的副本从右边移到上面。这意味着旋转块的左侧将设置所有的位,这显然不是我们想要的。我们可以通过为右侧集合创建一个只有目标位的数字,并将右侧操作数与其进行"与"运算来克服这一问题:

private function rotate ($decimal, $bits)
{
    return dechex(($decimal << $bits) | (($decimal >> (32 - $bits)) & (~(~0 << $bits) & $this->right32)));
}

当你把所有这些放在一起时,你会想到这样的东西,它适用于我的32位和64位系统。