从没有API的网站检索搜索引擎结果


Retriving search engine results from a website without API

我正在尝试类似的东西:

$url = “http://www.howtogeek.com”;
$str = file_get_contents($url);

显示整个网站。它不是$url中的网站,我试图检索结果的网站没有我可以使用的API。我想得到结果的数量,结果的标题等等。有什么简单的方法吗?

是的,您需要使用类似DomDocument类的DOM解析器。用法:

$doc = new DOMDocument();
$doc->loadHTML($html);

然后找到合适的方法来做你想做的事。

你也可以用preg_match_all()来做这件事,具体取决于你想做什么,但对于一个完整的网页来说,这几乎是不可能的,尤其是如果你自己不能控制源代码的话。