我正在尝试获取扩展ASCII字符集中某个字符的ASCII值。
类似:
echo ord('„');
其输出为:226
但实际的ASCII值是:132。
我的问题是如何获得那些大于1字节大小的字符的实际ASCII值?
ord
只需获取给定字符串的第一个字节,并以十进制形式返回其数值。如果它不能满足您的期望,则很可能您的输入不是您所期望的。如果您想要扩展ASCII的字节值,那么您的输入字符串必须用扩展ASCII编码。目前,您可能会得到E2 80 9E
的第一个字节的值,即"的UTF-8编码,因为您的输入实际上是UTF-8编码的,因为源代码文件保存为UTF-8。
我在这里找到了解决方案。您的字符在utf8编码中是8222,它被称为多字节字符(mb)或html特殊实体。
function mb_ord($string)
{
if (extension_loaded('mbstring') === true)
{
mb_language('Neutral');
mb_internal_encoding('UTF-8');
mb_detect_order(array('UTF-8', 'ISO-8859-15', 'ISO-8859-1', 'ASCII'));
$result = unpack('N', mb_convert_encoding($string, 'UCS-4BE', 'UTF-8'));
if (is_array($result) === true)
{
return $result[1];
}
}
return ord($string);
}
echo mb_ord('„');