是否可以使用PHP将文档文件转换为HTML


Is it possible to convert doc file to HTML using PHP?

我正在创建一个网站,作者可以在其中创建EPUB文件。用户将以.doc格式上传他们的书籍。我需要创建出EPUB文件。一个文档文件将包含多个章节。因此,我需要解析doc文件并将其拆分为多个章节。作者将使用Heading 1作为他们的章节标题。

那么在PHP中,有没有任何方法可以将doc文件解析为HTML,并使用Heading 1将其拆分为多个章节,这样我就可以创建EPUB文件。

经过一番研究,我得到了一个linux应用程序。但我认为,它会将文档转换为纯文本。因此,我将无法拆分章节。

如果有,请给我一个解决方案。提前谢谢。

您可以使用PHPDOCX API实现这一点。

首先尝试使用这个函数引用从Word文档生成XHTML

像这样的。。

require_once '../../classes/TransformDoc.inc';
$document = new TransformDoc();
$document->setStrFile('../files/Text.docx');
$document->generateXHTML();
$document->validatorXHTML();
echo $document->getStrXHTML();

在获得XHTML内容后,您可以进行各种处理,如删除章节等。

完整的文档可以在此处找到