使用大型搜索引擎 API 之一获取搜索结果数量


Get number of search results using one of the big search engine APIs

我正在寻找一种方法来检索给定查询的搜索结果数量(如在Google结果页面上)。目的是使用搜索 API 实现标准化的谷歌距离 (http://iknowate.blogspot.com/2011/10/google-similarity-distance.html);主要问题是请求的数量不应该太有限(Google API 似乎只允许 ~100 次查询/天)。

也许有人可以给我一个提示,我如何检索这些信息。

您可以使用

第三方库/类来抓取结果页面,然后遍历 DOM 以获取您的信息,或者使用 file_get_contents 获取页面,然后使用 preg_match 获取结果总数。另一种选择是使用 CURL 抓取页面,这也使您能够将脚本隐藏在多个代理后面,以防止在打算多次抓取页面时任何类型的禁令。