我想写一些PHP代码来解析一些HTML,以返回"image_url"类中所有图像的href和标题。我目前使用substr来查找字符串的位置,但是网页有时会改变内容,我不能总是依赖substr。是否有一种DOM方式或其他正则表达式方式,我可以找到这些元素在我的HTML?
<a class="image_url" href="/123.jpg" target="_blank"><img src="/123.jpg" border="0" title="Some dynamic length image title that is making this difficult for me"></a>
就我所知,你可以使用以下3种方法
- php domDoucment
- 。 <
- Simplehtmldom解析器/gh>
您可以尝试下面的示例代码。
$html='<a class="image_url" href="/123.jpg" target="_blank"><img src="/123.jpg" border="0" title="Some dynamic length image title that is making this difficult for me"></a>';
$dom = new DOMDocument();
$dom->loadHTML($html);
$elements = $dom->getElementsByTagName('a');
foreach ($elements as $child) {
echo $child->nodeValue;
}