在PHP中将PDF转换为文本文件(注意:shell_exec被禁用)


convert pdf to text file in php (note : shell_exec is disabled)

解决此问题

的最佳方法是使用"pdftotext",该"pdf"包位于"xpdf"包中,但在我用谷歌搜索shell_exec的所有共享主机中都被禁用。 我找到了仅使用 PHP 的替代 metods,例如名为 pdf2string() 的函数(在 php.net 上),但这些函数都没有按预期工作(对于某些 pdf 文件,它们只是没有输出正确的文本,而对于其他一些 pdf,它们没有输出任何内容和其他一些版本这个函数根本不起作用,所以我排除了这个选项)。有什么方法可以将开源pdftotext转换为PHP脚本吗?(我认为源代码在C ++中,可以在这里找到:http://www.foolabs.com/xpdf/download.html)。任何其他解决方案都将被接受,只要它给我PDF的文本输出(正确的一个)

由于您的环境受到限制,因此您可能需要查看此内容。http://webcheatsheet.com/php/reading_clean_text_from_pdf.php

这不使用外部库将 pdf 解析为文本格式。但是,由于此解析原始pdf格式的文本,因此我不确定它的稳定性如何。