正在提取动态<；标题>；标签 - Extracting dynamic <title> tags with PHP

Extracting dynamic <title> tags with PHP

本文关键字：标题 gt 标签 lt 动态提取 | 更新日期: 2023-09-27

我使用以下（简化的）PHP脚本提取页面的<title>标记：

function getTitle($Url){
    $contents = file_get_contents($Url);    
    $titlePattern = "/'<title'>(.*)'<'/title'>/";    
       if (preg_match($titlePattern,$contents,$title) && strlen($title[1]) > 0){
            return $title[1];
    } else {
        return "No title found";
    }
}

现在这适用于大多数网站，但我遇到了一些问题。例如，当脚本获取内容时，这篇新闻文章具有空白的<title>标记。

这是它的弱点：当链接在Facebook上共享时，文章标题会显示为"Lollygaged:不可保险的等待Android更新-ReadWrite。"但如果我打印file_get_contents()，则找不到该字符串。

脸书从哪里获得了上述标题
有没有其他办法让我获得真正的头衔？（不需要逐个网站编写特定的脚本）

谢谢！

您提供的链接，在视图源中没有标题。它可能来自javascript。请查看您网站的来源。你会发现<title></title>

脸书并没有得到它真正的标题。