PHP Tidy 错误地删除了结束 </head> 标签


PHP Tidy removes the closing </head> tag incorrectly

有一天我正在测试我的PHP Tidy配置,发现它无法处理来自卫报的任何页面。

我的配置是:

$tidy_config = array(
    'new-blocklevel-tags' => 'article aside audio figure footer header nav section source track video svg',
    'new-empty-tags' => 'source track',
    'new-inline-tags' => 'audio canvas embed video',
    'wrap' => 0,
    'markup' => false,
);

$tidy->body()输出一个空的主体,而我注意到$tidy->html()输出不包含原始</head>(存在于源代码中),而是将其移动到末尾(好像它是由 Tidy 本身添加的)。

我已经测试了卫报首页和一些新闻/专栏页面,同样的问题。在我的测试中,此配置适用于 BBC 或其他网站,至少我不希望它返回空body或移动结束head标签。

谁能弄清楚为什么?

PS:我的整洁发布版本是 25 March 2009 ,据我所知,这是最新版本

Sourceforge 上的 Tidy 票证系统中有一个功能请求,请求支持 HTML5。卫报页面使用的是HTML5。

另一方面,我想说Tidy不再被积极开发了。所有提交到 CVS 存储库中都是几年前的,最新的提交是在 21 个月前的实验目录中,改变了 HTML5 的一些内容。Github上还有一个分支,最后一次提交是在一年前。https://github.com/w3c/tidy-html5 你可以尝试编译这个。