提取pdf内容并将其转换为word或csv


Extract pdf content and convert it in word or csv

我是一个初学者。我有一个pdf文件。我想要一个php程序,其中我可以提取pdf的内容,并将其输出为word或csv。

要读取PDF文件,您需要安装XPDF包,其中包括"pdftotext"。安装XPDF/pdfotext后,您运行以下PHP语句以获取PDF文本:

content = shell_exec('/usr/local/bin/pdftotext '.$filename.' -');

获取内容后,下载PHPDOCX社区版本,这样尝试。

<?php
require_once '../../classes/CreateDocx.inc';
$docx = new CreateDocx();
$textInfo = $content;
$paramsTextInfo = array(
    'val' => 1,
    'i' => 'single',
    'sz' => 8
);
$docx->addText($textInfo, $paramsTextInfo);
$docx->createDocx('report.docx');
?>