我知道有很多类似的帖子,但到目前为止,尽管我通过了它们,但我无法解决我的问题。当我点击Search
按钮时,我正在尝试打印确切的search keywords
,但不幸的是我看到了编码版本,我无法解码。我阅读了utf8_decode和iconv,但到目前为止没有运气。我的网站中使用了多种语言,但我只是在为下面的字符而苦苦挣扎。
注意:我在MySQL中使用utf8mb4_unicode_ci
作为collation
,并且Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü
相同的关键字入到表中,因此由于编码差异,搜索在大多数情况下都会失败。
我还将内部字符设置为mb_internal_encoding("UTF-8");
搜索关键字: Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü
网站
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
</head>
<body>
<form method="post" action="search.php">
Keyword: <input type="text" name="keywords" />
<button type="submit" class="btn btn-default">Search</button>
</form>
</body>
</html>
搜索.php
var_dump($_POST);
echo $_POST['keywords'];
echo '<br />';
echo utf8_decode($_POST['keywords']);
echo '<br />';
echo iconv("ISO-8859-1", "UTF-8", $_POST['keywords']);
当 UTF-8 标记存在时输出
array (size=1)
'keywords' => string 'Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü' (length=46)
Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü
Ç, ?, ?, Ö, ?, Ü, ç, ?, ?, ö, ?, ü
Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü
删除 UTF-8 标记时的输出
// This will also break front-end for certain characters.
array (size=1)
'keywords' => string 'Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü' (length=64)
Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü
?, Ğ, İ, ?, Ş, ?, ?, ğ, ı, ?, ş, ?
Ç, Ğ, İ, Ö, Ş, Ãœ, ç, ğ, ı, ö, ş, ü
将accept-charset="ISO-8859-1"
添加到表单元素解决了这个问题。
输出
array (size=1)
'keywords' => string 'Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü' (length=64)
Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü
?, Ğ, İ, ?, Ş, ?, ?, ğ, ı, ?, ş, ?
Ç, Ğ, İ, Ö, Ş, Ãœ, ç, ğ, ı, ö, ş, ü
注意:无论我是否有mb_internal_encoding("UTF-8");
,都不会影响结果。
您是否在 PHP 中设置了内部编码? mb_internal_encoding("UTF-8");如果前端和后端都使用 UTF-8,应该没有问题!
这是您的解决方案。
根据您提供的数据,您混合了仅包含字符和 html 编码字符的字符串。
因此,要将它们解码回来,请使用html_entity_decode()
函数:
$str = 'Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü';
var_dump($str);
var_dump(html_entity_decode($str));