我正在尝试获取页面的总大小,包括图像,CSS和javascript。
我注意到一些东西飞来飞去,比如卷曲请求,然后使用curl_info来显示它下载了多少数据......这工作正常,但它不包括所有图像,CSS和javascript。
$curl = curl_init('http://www.dailymail.co.uk/news/article-2844384/It-s-mini-adventure-Astonishing-moment-frustrated-passengers-lift-Mini-way-tram-driver-parked-car-tracks.html');
curl_setopt($curl, CURLOPT_RETURNTRANSFER, TRUE);
curl_exec($curl);
//get the download size of page
print("Download size: " . curl_getinfo($curl, CURLINFO_SIZE_DOWNLOAD) .'<br>');
这将返回 381.285 kb,但返回 tools.pingdom.com 超过 5MB。
谁能帮我解决这个问题?
如果通过curl你可以看到页面,你必须得到每个图像,css和javascript,你preg_match每个rel,src等使用的示例。例:
$pattern = '/src="(.*)" /';
preg_match($pattern, substr($subject,3), $matches, PREG_OFFSET_CAPTURE);
getcurlsize($matches[1][0]);
您获得的页面内容$subject
getcurlsize 是您必须创建的函数才能获取 curl 文件大小信息