从.doc或.docx文件中提取字符串,删除该字符串,然后使用php以原始格式再次保存该文件


Extracting a String from .doc or .docx file, removing that string, and saving file again in origin format using php

我有一个invoice.doc文件,想要提取一个客户电子邮件地址,将其从文档文件中删除,在右上角添加一个公司徽标,并使用php以原始格式保存该文件。

MS Word以压缩格式保存其文件,因此如果不先解压缩,您将无法查看或编辑内容。如果你用普通的文本编辑器打开它,你就会知道我的意思了。

你最好的办法可能是使用PHPWord。看看这里:http://phpword.codeplex.com/

对于旧的.DOC文档,要提取电子邮件,可以使用AntiWord。修改文件是另一回事。如果您在安装了MS Office的Windows上,则可能使用ActiveX。

对于新的.DOCX格式,您确实有一些选择,因为基本上文档只是一个压缩的XML文件。