我们有一个论坛爬网引擎。当我使用curl抓取一些链接时,它在url中添加了一个变量,如s=223423235sdfsd234
例如forum.com/displayforum?php?f=34
将成为forum.com/displayforum?php?f=34s=23423235sdfsd234
通常在论坛上冲浪时,网址是没有s=blabla的。我相信这是自动添加到url的会话编号。有没有办法避免这种情况,因为我们的数据库中有相同url的重复项。
感谢
您需要在php.ini中设置session.use_only_cookies
…
http://www.php.net/manual/en/session.configuration.php#ini.session.use-仅cookie
你也可以用PHP来做。。。
ini_set('session.use_only_cookies', 1);