我的网站在编码方面遇到了很多麻烦。
这是我现在的问题,如果我去analize.php?dialog=árbol
代码是:
<?
echo $_GET['dialog'];
echo "sabía";
我得到:
sabÃa
sabía
我正在使用ANSI,更改为UTF-8会破坏两者。我不明白为什么会发生这种情况,而且上面没有任何代码。我不关心他们如何显示,因为这个文件只用于从我的数据库中获取数据。但是我需要使$_GET
正确显示,以便我可以将其包含在查询中。
如何做到这一点?
你不能在URL中发送字符"í", URL必须使用ASCII字符集的子集。因此,在发送到服务器之前,您的浏览器将URL编码为?dialog=sab%C3%ADa
。%C3%AD
表示两个字节的C3 AD
,是字符"í"的UTF-8编码。您可以通过var_dump($_SERVER['QUERY_STRING']);
确认这一点。这是由PHP自动解码的,结果是"sabía"的UTF-8字节序列,"í"使用两个字节C3 AD
进行编码。
您的浏览器正在使用Windows-1252或ISO-8859-1字符集解释此字节序列。字节C3
在此编码中表示"Ã",字节AD
表示软连字符,并且不可见。
两种可能的解决方案:
-
到处使用UTF-8(推荐!)
- 将源代码保存为UTF-8
-
输出一个头,强制浏览器将站点解释为UTF-8:
header('Content-Type: text/html; charset=utf-8');
-
将
$_GET
值转换为Windows-1252/ISO-8859-1(或任何你想在你的网站上使用的编码)使用mb_convert_encoding
或iconv
(不推荐)- 即使在这种情况下,你也应该设置一个标题,向浏览器宣布你正在使用的编码是什么
简而言之,您需要确保在所有地方使用相同的编码,并向浏览器指定该编码是什么。