如何使用 xpdf 解码 pdf 中的一些特殊字体


How to decode some special fonts in a pdf using xpdf?

我正在使用xpdf将pdf文件转换为文本。下面是用于它的代码。

$content = shell_exec('pdftotext '.$filename.' -');

Xpdf 无法将 pdf 中的一些特殊字体转换为文本。例如:奇异字体无法使用 XPDF 转换为文本。

它们是可以将pdf中的所有类型的字体转换为PHP文本的替代软件吗?

也许你应该尝试 Poppler 版本的 pdftotext 如果 XPDF 版本对你的文件失败......

但是,请注意这一事实: 即使是 Acrobat Reader 也无法将 PDF 页面上所有呈现良好的文本案例提取到文本文件中......