PHP导出带有BOM的CSV UTF-8;不起作用


PHP export CSV UTF-8 with BOM doesn't work

我已经被困在导出带有中文字符的UTF-8 CSV上好几天了,这些字符在Windows Excel上显示乱码文本。我使用的是PHP,已经添加了BOM字节标记并尝试了编码,但一点也不幸运。

它们在Notepad++、Google Spreadsheet甚至Mac Numbers上都能很好地打开。但不适用于客户要求的Excel。使用Notepad++打开时,编码显示为UTF-8。如果我手动将其更改为UTF-8并保存,该文件在Excel上会很好地打开。

似乎BOM字节标记没有保存在输出中,因为Notepad++总是将其检测为没有BOM的UTF-8。

此外,CSV不会保存在服务器上。数据从数据库中检索,然后直接导出。

这是我的代码:

// Setup headers
header('Cache-Control: must-revalidate, post-check=0, pre-check=0');
header('Content-Description: File Transfer');
header("Content-type: text/csv");
header("Content-disposition: filename=".$filename.".csv");
header("Pragma: no-cache");
// First Method
$fp = fopen('php://output', 'w');
// Add BOM to fix UTF-8 in Excel, but doesn't work
fputs($fp, chr(0xEF) . chr(0xBB) . chr(0xBF) );
if ($fp) {
    fputcsv($fp, array("Header"), ",");
    fputcsv($fp, array($string_with_chinese_chars), ",");
}
fclose($fp);
exit();
// Second Method
$csv = "";
$sep = ",";
$newline = "'n"; // Also tried with PHP_EOL
$csv .= "Header";
$csv .= $newline;
$csv .= $string_with_chinese_chars;
$csv .= $newline;
// Tried all the below ways but doesn't work.
// Method 2.1
print chr(255) . chr(254) . mb_convert_encoding($csv, 'UTF-16LE', 'UTF-8');
// Method 2.2
print chr(239) . chr(187) . chr(191) . $csv;
// Method 2.3
print chr(0xEF).chr(0xBB).chr(0xBF);
print $newline;
print $csv;

希望这能帮助到别人。对我有效的是,我必须把两者都放进去:

...
echo chr(0xEF) . chr(0xBB) . chr(0xBF);
$file = fopen('php://output', 'w');
fputs($file, chr(0xEF) . chr(0xBB) . chr(0xBF));
...

我不是PHP专家,所以我无法解释为什么这能起作用。我希望这能帮助到别人,因为我也很难解决这个问题。

以下代码对我有效。在csv内容之前输出utf-8-bom字符:

  echo "'xEF'xBB'xBF"; // utf-8 bom 
  echo $csv;

根据您上面的评论,您的脚本似乎意外地在UTF-8 BOM之前打印出了一行换行符(十六进制0A(,导致Excel无法将输出识别为UTF-8。

由于您使用的是PHP,请确保脚本中或脚本中可能包含的任何其他PHP文件中的<?php标记之前没有空行。还要确保包含的文件在结束?>标记之后都没有空格(如果有的话(。

在实践中,这可能很难做到,因为许多文本编辑器坚持总是在最后一行的末尾添加一行换行符。因此,最安全、最简单的解决方案是简单地从PHP文件中去掉?>标记,除非打算打印出它之后的任何内容。PHP不需要?>,在不打算混合PHP和文字模板HTML(或其他文本(的文件中使用它只会出现这样的错误。

我通常这样做:

header('Content-Type: application/csv');
header('Content-Disposition: attachment; filename="filename.csv"');
header('Cache-Control: max-age=0');
// BOM header UTF-8
echo "'xEF'xBB'xBF";
$fh = @fopen('php://output', 'w');
...

我使用;作为分隔符,因为excel很可能不会自动格式化,