PHP -使用file_get_contents更改阿拉伯字符的字符集


utf 8 - PHP - Changing charset for arabic characters using file_get_contents

我正在使用谷歌获得阿拉伯语翻译,这是我的代码:

header('Content-Type: text/html; charset=UTF-8');
$page=file_get_contents("http://www.google.com/translate_t?langpair=en|ar&text=hello",FILE_TEXT);
$page=substr($page,strpos($page,"TRANSLATED_TEXT")+strlen("TRANSLATED_TEXT")+2);
$page=substr($page,0,strpos($page,"';INPUT_TOOL_PATH"));
echo mb_detect_encoding($page); // edited 2015/05/26
echo mb_convert_encoding($page, 'UTF-8', 'ISO-8859-6');

如果您遵循file_get_contents函数上的链接,您将看到这个单词:مرحبا

但是如果你运行代码,你会得到:كرحبا

可以看到,最后(或第一个)字符是不同的!

我做错了什么?

将最后一行替换为:

echo iconv('WINDOWS-1256', 'UTF-8', $page);

我认为这是因为你使用了错误的编码,如果你检查页面返回的内容字符集元数据,你会看到它是windows-1256