使用cURL或DOM来抓取网页 - Using cURL or DOM to webscrape

Using cURL or DOM to webscrape

本文关键字：抓取网页 DOM cURL 使用 | 更新日期: 2023-09-27

我花了大约四个小时来研究这个问题，并且在网上找遍了所有的地方试图理解它，所以请温柔一点。

我想在我的php页面上显示一个外部来源的div。我试过使用file_get_dom, simplexml_load_file, file_get_contents和preg_match_all，然后在我的页面上打印它们，但它们不起作用。据我所见，卷发在我头上，我一点也不理解，但有人告诉我这是最好的方法。当我想要的只是抓取外部div的内容时，它们都会导致各种错误。我该怎么办?

一个例子是在这个页面上抓取div id='hmenus'，然后在我的本地页面上显示它。

谢谢!

如果你无法理解cURL，那么也许可以尝试简单的HTML DOM

$html = file_get_html($url);
echo $html->find('div[id=hmenus]', 0);