PDF到PNG或JPG转换,并再次失去字体


pdf to png or jpg conversion and back again with losing fonts

我需要通过PHP一次接受数百个pdf。我将这些文件存储在S3上,因此,文件大小将成为一个问题——不仅用于存储,而且用于一般处理。我发现减小文件大小的最好方法是从PDF转换到PNG,然后再转换回PDF。一个15M的文件下降到700kb。问题是我丢失了一些字体。有没有办法确保这不会发生?如何确保我使用的流程保持原始文档中的字体?是否有一些大型字体库我可以安装?

从命令行I've try…

Imagemagick内容pdftkInkscape(输出很好)

他们都取得了不同程度的成功,但每个人都失去了某些字体-而且并不总是相同的。

不行!

.PDF格式是"图形命令"的封装,例如"使用字体z在工作空间的位置(X,Y)呈现以下文本"。

当您将这样的文件"转换"为任何(!)"图像文件"格式时,实际上是在要求pdf引擎"执行那些图形命令",生成位图(像素的矩形网格…)作为其唯一的输出。

好吧,一旦你做了那, "你再也回不去了。"pdf引擎尽其所能渲染像素的矩形网格,现在,它和它所消耗的pdf文件都消失了,只留下(输出)像素的矩形网格。