我想读取一个文档文件并从中得到一些结果。
例如:如果我有一个文件- file。doc
和
简历姓名:john carter
地址:美国
我是一个php开发人员
然后我想要这样写:
array(
'name' => john carter
'Address' => USA
)
,并且拒绝来自它的附加信息
是可能的吗?
我试过用office,但是找不到任何与我的需求相关的东西。
我们可以很容易地得到整个文件的数据,但是我不能识别我想要的。
我需要的是类似的abbyy给图像到文本。
请大家帮帮我。
PHP docx阅读器:将MS Word docx文件转换为文本这个类可以将MS Word Docx文件转换为文本。
可以从压缩后的Microsoft Word文件中提取docx格式的文件
类可以解析文档XML文件并提取其中包含的文本。
引用自问题:https://stackoverflow.com/a/19503654/5212418