我有一个脚本,从第三方网站抓取内容,如果没有找到url的网站重定向与302头位置到一个自定义未找到的网页,而不是发送404未找到。该脚本还缓存由curl_exec返回的内容,但我不想缓存错误页面,所以有一种方法来记录这些重定向,如果我已经打开CURLOPT_FOLLOWLOCATION?我该如何解决这种情况?我知道我可以使用dom解析器找到错误消息,如果发现只是丢弃它,但我想知道是否有其他方法来实现这一点。
看看在PHP中测试404 URL的简单方法?
然后使用它,如果有404
看这里:
http://www.php.net/manual/en/function.curl-getinfo.php提供了这样的数据。这个特性内置于这个类中:
http://semlabs.co.uk/journal/object-oriented-curl-class-with-multi-threading我最终禁用了followlocation,所以我只需要捕捉302代码,如果它存在,我不缓存页面。我想在curl重定向之前会有一种方法捕获所有代码