字符编码/解码返回?提交表格时出现标志或奇怪的结果


Character encoding/decoding returns ? signs or weird results when form is submitted

我知道有很多类似的帖子,但到目前为止,尽管我通过了它们,但我无法解决我的问题。当我点击Search按钮时,我正在尝试打印确切的search keywords,但不幸的是我看到了编码版本,我无法解码。我阅读了utf8_decode和iconv,但到目前为止没有运气。我的网站中使用了多种语言,但我只是在为下面的字符而苦苦挣扎。

注意:我在MySQL中使用utf8mb4_unicode_ci作为collation,并且Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü相同的关键字入到表中,因此由于编码差异,搜索在大多数情况下都会失败。

我还将内部字符设置为mb_internal_encoding("UTF-8");

搜索关键字: Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü

网站

<!DOCTYPE html>
<html>
    <head>
        <meta charset="utf-8">
    </head>
    <body>
        <form method="post" action="search.php">
            Keyword: <input type="text" name="keywords" />
            <button type="submit" class="btn btn-default">Search</button>
        </form>
    </body>
</html>

搜索.php

var_dump($_POST);
echo $_POST['keywords'];
echo '<br />';
echo utf8_decode($_POST['keywords']);
echo '<br />';
echo iconv("ISO-8859-1", "UTF-8", $_POST['keywords']);

当 UTF-8 标记存在时输出

array (size=1)
      'keywords' => string 'Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü' (length=46)
Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü
Ç, ?, ?, Ö, ?, Ü, ç, ?, ?, ö, ?, ü
Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü

删除 UTF-8 标记时的输出

// This will also break front-end for certain characters.
array (size=1)
      'keywords' => string 'Ç, &#286;, &#304;, Ö, &#350;, Ü, ç, &#287;, &#305;, ö, &#351;, ü' (length=64)
Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü
?, Ğ, İ, ?, Ş, ?, ?, ğ, ı, ?, ş, ?
Ç, Ğ, İ, Ö, Ş, Ãœ, ç, ğ, ı, ö, ş, ü

accept-charset="ISO-8859-1"添加到表单元素解决了这个问题。

输出

array (size=1)
  'keywords' => string 'Ç, &#286;, &#304;, Ö, &#350;, Ü, ç, &#287;, &#305;, ö, &#351;, ü' (length=64)
Ç, Ğ, İ, Ö, Ş, Ü, ç, ğ, ı, ö, ş, ü
?, Ğ, İ, ?, Ş, ?, ?, ğ, ı, ?, ş, ?
Ç, Ğ, İ, Ö, Ş, Ãœ, ç, ğ, ı, ö, ş, ü

注意:无论我是否有mb_internal_encoding("UTF-8");,都不会影响结果。

您是否在 PHP 中设置了内部编码? mb_internal_encoding("UTF-8");如果前端和后端都使用 UTF-8,应该没有问题!

这是您的解决方案。

根据您提供的数据,您混合了仅包含字符和 html 编码字符的字符串。

因此,要将它们解码回来,请使用html_entity_decode()函数:

$str = 'Ç, &#286;, &#304;, Ö, &#350;, Ü, ç, &#287;, &#305;, ö, &#351;, ü';
var_dump($str);
var_dump(html_entity_decode($str));