copyscape如何保护自己免受captcha的攻击


How does copyscape protect itself from captcha?

www.copyscape.com使用谷歌api搜索重复内容。这怎么可能?如果我使用file_get_contents($google_search_url),它会起作用。但经过一番搜索后,它停止了工作。我发现了一些地方,它被告知compyscape隐藏它的ip到谷歌。但他们是如何从谷歌接收数据的。

Copyscape不使用Google API,而是使用Google搜索,它对http://www.google.com/search?q=Search此处的关键字。然后使用regexp模式查找标题、描述和链接,并向用户显示。但这严格违反了谷歌的服务条款,谷歌也可能会禁止他们,所以他们每次搜索都会使用代理(或任何其他ip隐藏方法)来隐藏他们的ip。