解决了问题。。永远不要使用file_get_contents。在所有情况下都必须使用cUrl,并且它有效。
我正在尝试使用cUrl登录到此网站:http://www.v-tac.ro/。
现在,基于标题和输入字段,我编写了这段php代码。
问题是这最后两个数组输入,我只是做了一个复制粘贴。。但是令牌是在每次加载页面时生成的,位于页面上作为输入隐藏字段。
所以问题是我如何获得一个新的代币?编辑-添加了我的全部功能:
function login_to_website($targetURL){
global $browser_user_agent;
if(empty($targetURL)) { return; }
if(empty($login_url)) { $login_url = $targetURL; }
$url = $login_url;
$login_user = "loginusername";
$login_password = "loginpassword";
$thetoken = "this-is-my-problem-the-token-from-the-hidden-input";
$post_data = array();
$post_data['username'] = "$login_user";
$post_data['password'] = "$login_password";
$post_data['Submit'] = "Conectare";
$post_data['option'] = "com_users";
$post_data['task'] = "user.login";
$post_data['return'] = "aW5kZXgucGhwP0l0ZW1pZD0yMTY%3D";
$post_data[$thetoken] = "1";
$postthis = http_build_query($post_data);
$login = curl_init();
curl_setopt($login, CURLOPT_COOKIEJAR, dirname(__FILE__) . "/cookie.tmpz");
curl_setopt($login, CURLOPT_COOKIEFILE, dirname(__FILE__) . "/cookie.tmpz");
curl_setopt($login, CURLOPT_VERBOSE, true);
curl_setopt($login, CURLOPT_URL, $url);
curl_setopt($login, CURLOPT_USERAGENT, random_user_agent());
curl_setopt($login, CURLOPT_FOLLOWLOCATION, TRUE);
curl_setopt($login, CURLOPT_RETURNTRANSFER, TRUE);
curl_setopt($login, CURLOPT_POST, TRUE);
$timeout = 5;
curl_setopt( $login, CURLOPT_CONNECTTIMEOUT, $timeout );
curl_setopt( $login, CURLOPT_TIMEOUT, $timeout );
curl_setopt( $login, CURLOPT_MAXREDIRS, 10 );
curl_setopt($login, CURLOPT_POSTFIELDS, $postthis); // POST vars
curl_setopt($login, CURLOPT_HEADER, 0); // debug headers sent - 1
$data = curl_exec ($login);
curl_setopt($login, CURLOPT_URL, $targetURL);
$datax = curl_exec ($login);
return $datax;
// close cURL resource, and free up system resources
curl_close($login);
}
原始的实时标头是这样的:
username=username&password=password&Submit=Conectare&option=com_users&task=user.login&return=aW5kZXgucGhwP0l0ZW1pZD0yMTY%3D&0dbf64fe20e2395a7d72ed5b64b3cf7c=1
编辑:
我得到的代币是这样的:
$htmlx = file_get_contents('http://www.v-tac.ro');
$htmlx = mb_convert_encoding($htmlx, 'UTF-8', mb_detect_encoding($htmlx)); //make sure this is utf8
if(!strlen($htmlx)) {echo "No HTML here . stoping execution with a return ."; return;}
$doc = new DomDocument;
@$doc->loadHTML($htmlx);
$xpath = new DOMXPath($doc);
echo $xpath->query('//fieldset[@class="userdata"]/input[5]')->item(0)->getAttribute("name");
$thetoken = $xpath->query('//fieldset[@class="userdata"]/input[5]')->item(0)->getAttribute("name");
最后的错误是:Token Invalid。
您将不得不执行多个请求。这段代码将首先下载网站,解析出您需要的值,并将它们写入post数组。:
$in=file_get_contents('http://www.v-tac.ro');
$re = '/<input type=''"hidden''" name=''"return''" value=''"([''w=]*)''" ''/>.*?<input type=''"hidden''" name=''"(''w*)''" value=''"1''" ''/>/s';
preg_match($re, $in, $out);
$post_data['return'] = $out[1];
$post_data[$out[2]] = "1";
var_dump($post_data);
如果这不起作用,请尝试用curl下载替换file_get_contents,以保持cookie(另请参阅此问题)
附言:大家可以随意评论一个更容易的RegExp