如何使用php或javascript提取PDF文件中的文本和图像


how can i extract text and image in PDF file using php or javascript

有人能帮助我使用php或javascript提取PDF文件中的文本和图像吗?我需要一个代码,而不是api。请帮帮我!谢谢

看看这个http://www.techumber.com/2015/04/html-to-pdf-conversion-using-javascript.html

基本上,您需要使用html2canvas和jspdf来使其工作。首先,您将把您的dom转换为图像,然后使用jspdf创建带有图像的pdf。

编辑:关于它如何工作的简短说明。我们将使用两个库来完成这项工作。http://html2canvas.hertzen.com/和https://github.com/MrRio/jsPDF首先,我们将使用html2canvas创建一个dom图像。我们将使用jspdf-addImage方法将该图像添加到pdf中。这看起来很简单,但jsPdf和html2cava中几乎没有错误,因此您可能需要暂时更改dom样式。希望这能有所帮助。

或者,如果您想通过按钮操作将页面打印为pdf格式,请尝试此操作。使用浏览器的Print...菜单项,您可以通过代码使用PDF打印机驱动程序。这样,在呈现页面时,浏览器会处理页面中包含的任何JavaScript。

<script> 
function swapCss() {
            window.print();
        }
     
   </script>
<input class="printbutton" type="button" onclick="swapCss();" value="Print Customer Copy"/>