cURL - 在浏览器中工作,而不是在 cURL 中工作


cURL - works in browser, not in cURL

我已经在这个任务上挣扎了将近三天,我想我缺少一些基本的cURL技能。

我从以下方面开始:

在IE的F12中,我在第一页上看到2个POST:(我注意到第一个得到一个302,这应该是一个重定向,而使用cURL,我只得到200)

填写验证码:

在第二页上(验证码之后):

交通:

这是我的代码(我不能继续使用它,因为它在早期阶段不起作用):

建立了一个特殊的表单,该表单使用GET(使用cURL)提交到我自己的页面,而cURL又访问了网站:

$id=$_GET['id']; // getting the biznumber
$humanCode=$_GET['nobot'];
$curl = curl_init();
curl_setopt ($curl, CURLOPT_URL, "https://www.*******.******.***");

// setting some https to be able to access the website from my local computer.
curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, true);
curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, 2);
curl_setopt($curl, CURLOPT_CAINFO, "c:/xampp/htdocs/CAcerts/curl-ca-bundle.crt");
// I know the values for the ASPX vars like __EVENTTARGET, __EVENTARGUMENT, __VIEWSTATE are arbitrary now. I need to take care of that but I don't yet know how.
$postarr= array (
                "__EVENTTARGET"=>"",
                "__VIEWSTATE=" =>"%2FwEPDwULLTEzMzI2OTg4NDYPZBYCZg9kFgQCBA8PZBYCHgdvbmNsaWNrBQxnb1RvTWl2emFrKClkAgYPD2QWAh8ABQxnb1RvTWl2emFrKClkZM6iZZ0Qaf2CpfXoJJdZ0IqaWsDO",
                "__EVENTARGUMENT=" =>"",
                "__EVENTVALIDATION" =>"%2FwEWBQKgysLGCwL2r7SGDQLh4ri%2BAwLWws7NDwLWwpLPD%2F1HuCAFYzs2seaziWbYEXjDfigP",
                "hidUrlFileIshurim"=>"https%3A%2F,
"cod"=>"3322"
                    );
$fields_string='';
foreach($postarr as $key=>$value) { $fields_string .= $key.'='.$value.'&'; }
rtrim($fields_string,'&');
curl_setopt($curl, CURLOPT_POST      ,1);
curl_setopt($curl, CURLOPT_POSTFIELDS, $fields_string);
curl_setopt($curl, CURLOPT_TIMEOUT, 10);
curl_setopt ($curl, CURLOPT_USERAGENT, "User-Agent  Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; MAAU)");
// I made a cookie file and it seems to work
$cookiefile = "d:/cookie.txt";
curl_setopt($curl, CURLOPT_COOKIEJAR, $cookiefile); 
curl_setopt($curl, CURLOPT_COOKIEFILE, $cookiefile);
curl_setopt($curl, CURLOPT_FRESH_CONNECT , 1);
curl_setopt($curl, CURLOPT_FOLLOWLOCATION  ,1);
curl_setopt($curl, CURLOPT_HEADER      ,1);  // DO NOT RETURN HTTP HEADERS
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
$temp=curl_exec($curl);
$info = curl_getinfo($curl);
$html = mb_convert_encoding($temp, 'HTML-ENTITIES', 'utf-8'); 
echo "ERRCODE: ".curl_error($curl);
echo '<br /><br />';
echo "INFO : ";
print_r($info);
echo '<br /><br />';
$httpcode = curl_getinfo($curl, CURLINFO_HTTP_CODE);
echo "CODE: ".$httpcode;
echo '<br /><br />';
echo "CODE: ".$httpcode;
echo '<br /><br />';
echo "VARS: ".$vars;
echo '<br /><br />';
//echo $html;
curl_setopt ($curl, CURLOPT_URL, "https://www.*******.******.***");
curl_setopt($curl, CURLOPT_FRESH_CONNECT , 0);
echo "<br /><br /><b>2nd</b><br /><br />";
$temp=curl_exec($curl);
$info = curl_getinfo($curl);
$html = mb_convert_encoding($temp, 'HTML-ENTITIES', 'utf-8'); 
echo "ERRCODE: ".curl_error($curl);
echo '<br /><br />';
echo "INFO : ";
print_r($info);
echo '<br /><br />';
echo $html;

甚至无法让它开始工作。它首先是给我一个200OK,而不是302,有时我也得到500。

我知道 ASPX 变量实际上可能至关重要,但是如果我的浏览器可以制作这些变量并将它们发送到服务器,cURL 不能做同样的事情吗?

感谢您的任何帮助!

问题解决了。
这是使用正确标题的问题。按照浏览器的报告,我完成了所有步骤,结果出现了。

我通过使用以下方法完成了每个步骤:

curl_init
curl_setopt()
..
curl_setopt()
curl_exec()
curl_close()

这样,我必须手动设置每个请求并完成设置。它使代码更长,但更容易理解。

我对使用一些javascript特殊代码使网站工作的网站有想法,所以我对所有额外的javascript代码感到困扰,结果证明这是不必要的。

这一切都是为了更有条理并遵循正确的标题设置。

此外,由于这是一个ASPX站点,我必须阅读并记住每次迭代中最后一页的VIEWSTATEVALIDATION。这是我过去一直收到 500 个内部错误服务器消息的第一个也是非常原因。

我使用Firebug和LiveHttpHeaders来协调每个步骤。

"甚至无法开始工作。它首先是给我一个200OK,而不是302,有时我也得到500。

curl_setopt($curl, CURLOPT_FOLLOWLOCATION  ,1);

您已将 Curl 设置为遵循任何 302 重定向。这些将在 Curl 内部遵循,不会被 PHP 看到。

也:

curl_setopt($curl, CURLOPT_HEADER      ,1);  // DO NOT RETURN HTTP HEADERS

注释的作用与代码的作用完全相反。这似乎是错误的。

在你制作cURL之前,你需要查看所使用的requeste字段。 通常 HTTP 500 来自 ASPX 找不到字段发送。

foreach($postarr as $key=>$value) { 
  $fields_string .= $key.'='.$value.'&'; 
  echo" $fields_string <br> ";
}

确保在发送请求时该字段不是动态的。希望这有帮助..

我用了这个:

curl_setopt($ch, CURLOPT_USERAGENT, $_SERVER["HTTP_USER_AGENT"]);

有点模拟卷曲,就像它有一个浏览器名称和版本一样。