关于常量时间算法和字符串比较的说明


Explanation about constant-time algorithm and string comparision

我有一个问题,无法理解两种不同的字符串比较方式。给定的是以下函数,它比较两个字符串。此功能在Symfony-Framework安全组件中用于比较用户登录过程中的密码。

/**
 * Compares two strings.
 *
 * This method implements a constant-time algorithm to compare strings.
 *
 * @param string $knownString The string of known length to compare against
 * @param string $userInput   The string that the user can control
 *
 * @return Boolean true if the two strings are the same, false otherwise
 */
function equals($knownString, $userInput)
{
    // Prevent issues if string length is 0
    $knownString .= chr(0);
    $userInput .= chr(0);
    $knownLen = strlen($knownString);
    $userLen = strlen($userInput);
    $result = $knownLen - $userLen;
    // Note that we ALWAYS iterate over the user-supplied length
    // This is to prevent leaking length information
    for ($i = 0; $i < $userLen; $i++) {
        // Using % here is a trick to prevent notices
        // It's safe, since if the lengths are different
        // $result is already non-0
        $result |= (ord($knownString[$i % $knownLen]) ^ ord($userInput[$i]));
    }
    // They are only identical strings if $result is exactly 0...
    return 0 === $result;
}
来源

:来源代码段

我很难理解equals()函数和简单比较===之间的区别。我写了一个简单的工作示例来解释我的问题。

给定字符串:

$password1 = 'Uif4yQZUqmCWRbWFQtdizZ9/qwPDyVHSLiR19gc6oO7QjAK6PlT/rrylpJDkZaEUOSI5c85xNEVA6JnuBrhWJw=='; 
$password2 = 'Uif4yQZUqmCWRbWFQtdizZ9/qwPDyVHSLiR19gc6oO7QjAK6PlT/rrylpJDkZaEUOSI5c85xNEVA6JnuBrhWJw==';
$password3 = 'iV3pT5/JpPhIXKmzTe3EOxSfZSukpYK0UC55aKUQgVaCgPXYN2SQ5FMUK/hxuj6qZoyhihz2p+M2M65Oblg1jg==';

示例 1(按预期操作)

echo $password1 === $password2 ? 'True' : 'False'; // Output: True
echo equals($password1, $password2) ? 'True' : 'False'; // Output: True

示例 2(按预期执行)

echo $password1 === $password3 ? 'True' : 'False'; // Output: False
echo equals($password1, $password3) ? 'True' : 'False'; // Output: False

我读过关于卡普·拉宾算法的信息,但我不确定equals()函数是否代表卡普·拉宾算法,总的来说我不明白维基百科的文章。

另一方面,我读到equals()功能将防止暴力攻击,对吗?有人可以解释一下equals()的优势是什么吗?或者有人可以给我一个例子,===会失败并且equals()做正确的工作,这样我就可以理解优势吗?

恒定时间算法是什么意思?我认为恒定时间与实时无关,或者如果我错了?

这个函数只是一个普通的字符串比较函数。这不是拉宾·卡普。它不是恒定时间,它是线性时间,无论评论说什么。它也不能防止暴力攻击。

工作原理:

  1. 如果正确的密码和用户提供的密码长度不同,则设为 $result != 0
  2. 遍历用户提供的密码,用正确密码的相应字符对其每个字符进行 xor (如果正确的密码较短,请继续绕圈浏览它),并按位或每个结果$result。

由于仅使用按位 OR,如果任何字符不同,则$result为 != 0。需要步骤 1,否则,如果真实密码是"abc",则会接受用户输入"abca"。

为什么有时会使用这样的字符串比较函数

假设我们以通常的方式比较字符串,正确的密码是"bac"。我们还假设我可以精确测量完成密码检查所需的时间

我(用户)尝试abc...他们不起作用。

然后,我尝试aa.该算法比较前 2 个字母 - ba ,看到它是错误的,并返回 false。

我现在尝试使用bb.该算法比较bb,它们匹配,因此它继续字母#2,比较ab,看到它是错误的,返回false。现在,由于我能够精确地计时算法的执行,我知道密码以"b"开头,因为第二次传递比第一次花费更多的时间 - 我知道第一个字母匹配。

所以我尝试babbbc...他们失败了。

现在我检查baabbb,看到baa运行速度较慢,因此第二个字母a。这样,我可以逐个字母地确定密码,而不是暴力破解所需的 O(c^N) 次尝试。

这通常并不像这个解释听起来那么令人担忧,因为攻击者不太可能将字符串比较的时间定为如此准确。但有时可以。