使用cURL或DOM来抓取网页


Using cURL or DOM to webscrape

我花了大约四个小时来研究这个问题,并且在网上找遍了所有的地方试图理解它,所以请温柔一点。

我想在我的php页面上显示一个外部来源的div。我试过使用file_get_dom, simplexml_load_file, file_get_contentspreg_match_all,然后在我的页面上打印它们,但它们不起作用。据我所见,卷发在我头上,我一点也不理解,但有人告诉我这是最好的方法。当我想要的只是抓取外部div的内容时,它们都会导致各种错误。我该怎么办?

一个例子是在这个页面上抓取div id='hmenus',然后在我的本地页面上显示它。

谢谢!

如果你无法理解cURL,那么也许可以尝试简单的HTML DOM

$html = file_get_html($url);
echo $html->find('div[id=hmenus]', 0);