在PHP中,我有以下字符串:=CA=CC=D1=C8=C9
它的字符编码是什么?
不知道字符串使用什么编码是没有意义的。
这5个字节在不同的编码中有不同的含义。
- 在UTF-8中无效。所有前导字节,没有尾字节。
- 在ISO-8859-1和windows-1252中,是字符串
ÊÌÑÈÉ
。 - 根据chardet,为KOI8-R格式,解码为
йляхи
您得到的答案和注释假设您已经知道传输编码是"引号-可打印的"…解码使用,"=CA=CC=D1=C8=C9"变成"'xCA'xCC'xD1'xC8'xC9"(这不是UTF-8,正如你在评论中所要求的)…他们专注于用什么编码可以合理地产生统一码。要得到UTF-8,还需要两个步骤:将"'xCA'xCC'xD1'xC8'xC9"解码为Unicode(使用适合阿拉伯文本的编码),然后编码为UTF-8。
被称为引号printable
我可以使用:
解码它quoted_printable_decode($string);