如何使用 SimpleHTMLdom 提取原始 HTML 代码


how to extract raw html code using simplehtmldom

我正在尝试使用simplehtmldom从网页中提取原始html。 我想知道是否可以使用该库。

例如,假设我有一个尝试从中提取数据的网页。

<div class="class1">
  <div class="class2">
    <div class="class3">
    <p>p1</p>
    <h1>header here!</h1>
    <p>p2</p>
    <img src="someimage"></img>
</div>
</div>
</div>

我的目标是提取div class3 中的所有内容,包括原始 html 代码,这样当我获得数据时,我可以将其输入到允许输入源代码的文本框中,以便它的格式与网页中的格式相同。

我查看了简单的htmldom手册并进行了一些搜索,但尚未找到解决方案。

谢谢。

使用示例 html 字符串

 $html = str_get_html('<div class="class1">
  <div class="class2">
    <div class="class3">
    <p>p1</p>
    <h1>header here!</h1>
    <p>p2</p>
    <img src="someimage"></img>
</div>
</div>
</div>');      
// Find all divs with class3
foreach($html->find('div[class=class3]') as $element) {
    echo $element->outertext;
}