从网站上的每个页面提取标题和描述的任何方法


Any way to extract title and description from every page on a site?

我有两个版本的网站:

一个我不再有ftp/代码访问权限,还有一个几乎相同的我有ftp//代码访问权限的,但已经去掉了标题和描述标签。有没有一种方法(PHP或其他)可以抓取我不再直接访问的网站,并提取所有页面的标题/描述元标签?

我想把这些标签插入到我可以访问的网站的新版本中。

您可以使用它从页面中提取元描述:

$xpath = new DOMXPath($doc);
$description = $xpath->query('/html/head/meta[name@="description"]/@content');

这是一个替代解决方案:

$doc = new DOMDocument;
$doc->loadHTMLFile('http://example.com');
$title = $doc->getElementsByTagName('title');
$title = $title[0];
$metas = $doc->getElementsByTagName('meta');
foreach ($metas as $meta) {
  if (strtolower($meta->getAttribute('name')) == 'description') {
    $description = $meta->getAttribute('value');
  }
}

来源:#6113716