使用PHP扫描网页,获取页眉、页脚、菜单、子菜单和超链接


Scan web page get header, footer, menu, sub menu and hyperlink using PHP

是否有任何方法可以通过使用PHP扫描网页来获取页眉、页脚、菜单、子菜单、横幅和超链接?

如果有人有什么想法,请告诉我。

是的,您可以扫描和解析网页HTML中的任何内容。但请注意,您应该了解页面的HTML结构,并且该结构在理想情况下永远不应该更改,因为如果这样做,您的解析逻辑可能会失败。

步骤包括:

  1. 阅读网页。您可以使用fopen()或file_get_contents()或CURL。我建议CURL,因为它提供了许多有用的选项,比如从代理连接。对于前两种方法,需要启用"fopen包装器"。

  2. 您可以使用正则表达式来解析返回的HTML中的特定内容,但这些内容可能很难生成。我建议使用DOMDocument库,因为它可以轻松地读取任何HTML标记或属性。玩它,你会喜欢它。

顺便问一下,你为什么想从网页上读这么多?网页通常是为了读取动态信息而读取的,但页眉、页脚和菜单几乎是静态的。

您必须使用报废代码,首先使用$a=file_get_contents($url);解析url,然后使用->运算符遍历解析json输出$arrjson=json_decode($a);