我正在创建一个网站,作者可以在其中创建EPUB文件。用户将以.doc
格式上传他们的书籍。我需要创建出EPUB文件。一个文档文件将包含多个章节。因此,我需要解析doc
文件并将其拆分为多个章节。作者将使用Heading 1
作为他们的章节标题。
那么在PHP
中,有没有任何方法可以将doc
文件解析为HTML
,并使用Heading 1
将其拆分为多个章节,这样我就可以创建EPUB文件。
经过一番研究,我得到了一个linux应用程序。但我认为,它会将文档转换为纯文本。因此,我将无法拆分章节。
如果有,请给我一个解决方案。提前谢谢。
您可以使用PHPDOCX API实现这一点。
首先尝试使用这个函数引用从Word文档生成XHTML
像这样的。。
require_once '../../classes/TransformDoc.inc';
$document = new TransformDoc();
$document->setStrFile('../files/Text.docx');
$document->generateXHTML();
$document->validatorXHTML();
echo $document->getStrXHTML();
在获得XHTML内容后,您可以进行各种处理,如删除章节等。
完整的文档可以在此处找到。