找到一个匹配项,然后在它之前和之后抓取一些 html


Find a match, then grab some html before and after it

在php中,我正在从其他外部站点之一抓取一些html。我正在执行抓取并以 php 字符串获取所有页面 html。我需要在此字符串中找到第一个.png文件类型。然后,我需要从这一点抓取 html 以找到它之前的开头 http,并在以下字符开始"''u002522"之前抓取它之后的 html。有什么想法吗?

所以:

<html><head><title>Hello</title></head><body><p>Here's a nice image</p><img src="http://www.exampleurl.com/image.png?id=35435646&v=5647''u002522"/></body></html>

会变成:

http://www.exampleurl.com/image.png?id=35435646&v=5647

我到处寻找同时组合所有这些东西,但没有运气:(

我以前用过这个,它对我来说效果很好。如何使用php从html中提取img src,title和alt?

然后只需清理 URL 并在//上拆分。

如果我需要更具体,请告诉我。