转换文件编码


Convert files encoding

我有一个PHP应用程序,其文件编码是希腊语ISO (iso-8859-7)。我想将文件转换为 utf-8,但仅仅使用 utf-8 保存文件是不够的,因为希腊文本会乱码。是否有一种"自动"方法可以执行此操作,以便我可以完全转换应用程序的编码,而无需浏览每个文件并重写文本?

在 Linux 系统上,如果您确定所有文件当前都以 ISO-8859-7 编码,则可以执行以下操作:

bash> find /your/path -name "*.php" -type f '
    -exec iconv "{}" -f ISO88597 -t UTF8 -o "{}.tmp" '; '
    -exec mv "{}.tmp" "{}" ';

这将转换位于/your/path中的所有 PHP 脚本文件以及所有子目录。删除-name "*.php"以转换所有文件。


由于您是在Windows下,最简单的选择是像这样的PHP脚本:

<?php
$path = realpath('C:''your''path');
$iterator = new RecursiveIteratorIterator(
    new RecursiveDirectoryIterator($path), 
    RecursiveIteratorIterator::SELF_FIRST
);
foreach($iterator as $fileName => $file){
    if($file->isFile())
        file_put_contents(
            $fileName,
            iconv('ISO-8859-7', 'UTF-8', file_get_contents($fileName))
        );
}

尝试 iconv 函数

$new_string = iconv("ISO-8859-7", "UTF-8", $old_string);
<?php
function writeUTF8File($filename,$content) { 
        $f=fopen($filename,"w"); 
        # Now UTF-8 - Add byte order mark 
        fwrite($f, pack("CCC",0xef,0xbb,0xbf)); 
        fwrite($f,$content); 
        fclose($f); 
}
?>

以下代码应该适合您,它是一个 PowerShell 脚本,您可以在修改所需行后Start > Run > powershell和粘贴代码。

$sourcepath = "d:'temp'old'"
$targetpath = "d:'temp'new'"
foreach ($file in Get-ChildItem $sourcepath -Filter *.php -Recurse) {
  $content = [System.IO.File]::ReadAllBytes($sourcepath + $file)
  $str = [System.Text.Encoding]::GetEncoding("ISO-8859-7").GetString($content)
  # $str = $str.Replace("ISO-8859-7", "UTF-8")
  [System.IO.File]::WriteAllText($targetpath + $file, $str)
}

您可以在保存之前删除第 6 行#字符以进行一些替换。