在阿拉伯语单词中搜索阿拉伯字母


search arabic letters in arabic words

下面是我的工作代码:

<!DOCTYPE HTML>
<html>
    <head>
        <meta http-equiv='Content-Type' content='text/html; charset=UTF-8'/>
    </head>
    <body>
        <?php
            $arabic = "صحيفة اسبوعية مستقلة شاملة تتابع الاخبار فى المنطقة العربية";
            $french = "que voulez vous dire?";
            if (isset($_POST['search'])) {
                $search = $_POST['search'];
                $key = $_POST['key'];
                $td = substr_count($arabic, $key);
                echo $td;
            }
            echo "<br />" . $arabic;
            function count_occurences($char_string, $haystack, $case_sensitive = true) {
                if ($case_sensitive === false) {
                    $char_string = strtolower($char_string);
                    $haystack = strtolower($haystack);
                }
                $characters = preg_split('//u', $char_string, -1, PREG_SPLIT_NO_EMPTY);
                //$characters = str_split($char_string);
                $character_count = 0;
                foreach ($characters as $character) {
                    $character_count = $character_count + substr_count($haystack, $character);
                }
                return $character_count;
            }
        ?>
        <form name="input" action="" method="post">
            <input  type= "text" name="key" value=""/>
            <input  type ="submit" name="search" value =" find it !"/>
        </form> 
    </body>
</html>

对于$french,它工作得很好,但是对于$arabic,它不工作。当然没有错误,但是如果我输入ح来搜索那个字母,对于我输入的每个字母,它总是显示0

有什么不对吗?还是我错过了什么阿拉伯语?我不知道为什么在$french工作良好,如果我输入v它显示2的结果。

您需要使用多字节字符串函数

您也可以在php.ini中设置mbstring.func_overload = 7, php将自动使用多字节的标准字符串函数。

如果你想在重载函数中使用其他更适合你需要的值,请查看mbstring重载文档

同时,取代

$characters = str_split($char_string);

$characters = preg_split('//u', $char_string, -1, PREG_SPLIT_NO_EMPTY);

因为str_split不是多字节安全的,并且没有替代

另外,如果在提交表单后头中没有发送编码,或者有一些问题,您可以在php.ini

中设置。

default_charset = "UTF-8"

我用编码UTF-8测试了你的代码,它的工作。

我添加了一个meta标签:

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">