如何使用简单的HTML DOM php爬行页面

How to crawl through pages using Simple HTML DOM php?

本文关键字：php 爬行 DOM HTML 何使用简单 | 更新日期: 2023-09-27

我正在从这个页面收集数据。我使用简单的HTML DOM解析器。我想从下一页收集数据。问题是没有新的链接为下一页，所以我不能通过链接循环。我猜它是由Javascript完成的。我如何进入下一页并从那里收集数据?

    `// array to store scraped links
    $links = array();  
    // crawl the webpage for links
    foreach($html->find("a") as $link){
        array_push($links, $link->href);
    }`

使用上面的代码，我只能找到页面上的链接。但是页码1、2、3……没有链接。

您是否尝试使用PhantomJS/CasperJS来完成此任务?它们非常适合模拟用户请求和抓取网页。

奇怪的错误:相同的PHP代码，但在mac和windows机器上的结果不同
使用php将excel文件中的印地语字体添加到数据库中
使用PHP和AngularJS显示JSON文件
可以'；t上传并取消链接图像php
显示Slider，除非存在Upsells-PHP if Statment
使用php从网页下载图像
使用foreach循环用MYSQL SELECT中的数据填充PHP数组
用PHP格式化日期
如何使用PHP在html表中添加分页
PHP网站-Twitter API+Abraham Oauth(找不到x_rate_limit_remaining）
使用php或javascript从facebook相册URL中删除多余的部分
fgetCsv返回php中csv文件的空值
如何在我的 PHP 代码中添加参数
经过身份验证的curl在php中不起作用
使用 PHP 进行网络爬行
在 PHP 中使用 Curl 进行网络爬行
自动爬行/抓取过程输出到.txt文件使用php, javascript或cURL(内部测试)
如何使用简单的HTML DOM php爬行页面
爬行游戏商店在核心php
如何确定真正的用户是浏览我的网站或只是爬行或其他PHP