DOMDocument,在第一个<h1>之后获取图像


DOMDocument, get images AFTER first <h1>

我试图在第一个<h1>标签之后获取所有<img>标签,但我不太清楚如何。

目前,我可以使用以下代码从页面获取所有<img>标签:

$html = file_get_contents($this->url);
$this->doc = new DOMDocument();
@$this->doc->loadHTML($html);
$tags = $this->doc->getElementsByTagName('img');
foreach ($tags as $tag) {
    array_push($this->images, $tag->getAttribute('src'));
}

如何让它在第一个<h1>标签之后执行此操作?

对于 php,请获取一个 dom 解析器。http://simplehtmldom.sourceforge.net/manual.htm#section_traverse

找到 h1 标签,然后遍历搜索 img 标签的兄弟姐妹。

$es = $html->find( 'h1' )

foreach($es->next_sibling() as $sibling) 
{
       foreach($sibling->find( 'img' ) as $img ) 
       {
             // do something...
       }
}