下面是我的工作代码:
<!DOCTYPE HTML>
<html>
<head>
<meta http-equiv='Content-Type' content='text/html; charset=UTF-8'/>
</head>
<body>
<?php
$arabic = "صحيفة اسبوعية مستقلة شاملة تتابع الاخبار فى المنطقة العربية";
$french = "que voulez vous dire?";
if (isset($_POST['search'])) {
$search = $_POST['search'];
$key = $_POST['key'];
$td = substr_count($arabic, $key);
echo $td;
}
echo "<br />" . $arabic;
function count_occurences($char_string, $haystack, $case_sensitive = true) {
if ($case_sensitive === false) {
$char_string = strtolower($char_string);
$haystack = strtolower($haystack);
}
$characters = preg_split('//u', $char_string, -1, PREG_SPLIT_NO_EMPTY);
//$characters = str_split($char_string);
$character_count = 0;
foreach ($characters as $character) {
$character_count = $character_count + substr_count($haystack, $character);
}
return $character_count;
}
?>
<form name="input" action="" method="post">
<input type= "text" name="key" value=""/>
<input type ="submit" name="search" value =" find it !"/>
</form>
</body>
</html>
对于$french
,它工作得很好,但是对于$arabic
,它不工作。当然没有错误,但是如果我输入ح
来搜索那个字母,对于我输入的每个字母,它总是显示0
。
有什么不对吗?还是我错过了什么阿拉伯语?我不知道为什么在$french
工作良好,如果我输入v
它显示2
的结果。
您需要使用多字节字符串函数
您也可以在php.ini
中设置mbstring.func_overload = 7
, php将自动使用多字节的标准字符串函数。
如果你想在重载函数中使用其他更适合你需要的值,请查看mbstring重载文档
同时,取代
$characters = str_split($char_string);
$characters = preg_split('//u', $char_string, -1, PREG_SPLIT_NO_EMPTY);
因为str_split
不是多字节安全的,并且没有替代
另外,如果在提交表单后头中没有发送编码,或者有一些问题,您可以在php.ini
中设置。 default_charset = "UTF-8"
我用编码UTF-8测试了你的代码,它的工作。
我添加了一个meta标签:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">