获取页面标题的好策略是什么


What is a good strategy for getting the title of a page?

...服务器端和使用PHP。

我阅读了这篇关于何时使用正则表达式的 SO 文章,它基本上指出在某些情况下您可以使用正则表达式来解析 HTML。

<title></title>

应该很容易匹配。

我认为这没有问题。 我认为流行的答案不是因为正确性而投票,而是因为夹带价值。

可以吗?

是的,它是

/<title[^>]*>(.*?)<'/title>/is

不过,不同的人有不同的看法。而且,只有当您知道自己在做什么时,才应该使用正则表达式。
这可能是我一个非常有趣的阅读:什么时候不应该使用正则表达式?

最好的选择是使用 HTML 解析库(像这个(,而不是正则表达式。在这种情况下,您可能会侥幸使用正则表达式,但这就像使用锤子敲击螺丝一样。

如果你在HTML中寻找任何不平凡的东西,正则表达式将非常混乱且难以阅读,在许多情况下,正则表达式如果不对HTML的内容做出许多假设,就无法完成这项工作。