PHP DOM中的XML/HTML无效问题


Problem with invalid XML/HTML in PHP DOM

假设您有以下HTML:

<style><input><div name="myDiv"></div></style>

如果你想把它加载到一个PHP DOMDocument对象中,你应该怎么做?如果使用$doc->loadHTML(),则会出现<div>位于<style>标记内部的问题。如果使用$doc->loadXML(),则会出现<input>标记无法关闭的问题。

注意:我不能编辑HTML,只能编辑用来解析它的PHP,因为我在这里抓取。

试试这个:

$doc = new DOMDocument;
$doc->recover = true;
$doc->loadXml($response);

$doc->recover = true命令DOMDocument尝试解析格式不正确的文档。有关详细信息,请参阅文档。

你不能把html变成一个字符串,分解它,然后用结束标记把它缝合回来吗?