PHP:这个字符串的字符编码是什么?


PHP: What is that character encoding of this string?

在PHP中,我有以下字符串:=CA=CC=D1=C8=C9

它的字符编码是什么?

不知道字符串使用什么编码是没有意义的。

这5个字节在不同的编码中有不同的含义。

  • 在UTF-8中无效。所有前导字节,没有尾字节。
  • 在ISO-8859-1和windows-1252中,是字符串ÊÌÑÈÉ
  • 根据chardet,为KOI8-R格式,解码为йляхи

您得到的答案和注释假设您已经知道传输编码是"引号-可打印的"…解码使用,"=CA=CC=D1=C8=C9"变成"'xCA'xCC'xD1'xC8'xC9"(这不是UTF-8,正如你在评论中所要求的)…他们专注于用什么编码可以合理地产生统一码。要得到UTF-8,还需要两个步骤:将"'xCA'xCC'xD1'xC8'xC9"解码为Unicode(使用适合阿拉伯文本的编码),然后编码为UTF-8。

被称为引号printable

我可以使用:

解码它
quoted_printable_decode($string);