正在分析Wiki API内容


Parsing Wiki API content

我有这个来自API的维基http://fr.wikipedia.org/w/api.php?action=query&title=%C9 rythropo%EF%E9tine&prop=修订&rvprop=内容&format=xmlfm

我想检索的主要内容从:

L''''érythropoïétine''' ('''EPO''') est une [[hormone]] ......etc

我试着用这个从顶部开始,从单词"{{Chimiebox…"到底部"}}

preg_replace( '/^{{(.*)}}$/sim', '', $value[0]['*'] );

但有点不起作用。。有人知道确定内容开头的好方法吗??谢谢你的建议。

嗯,也许大多数项目都直接使用维基百科解析器,例如我所在大学的维基百科离线客户端项目。由于您似乎在使用php,这可能是最简单的方法。