有一天我正在测试我的PHP Tidy配置,发现它无法处理来自卫报的任何页面。
我的配置是:
$tidy_config = array(
'new-blocklevel-tags' => 'article aside audio figure footer header nav section source track video svg',
'new-empty-tags' => 'source track',
'new-inline-tags' => 'audio canvas embed video',
'wrap' => 0,
'markup' => false,
);
$tidy->body()
输出一个空的主体,而我注意到$tidy->html()
输出不包含原始</head>
(存在于源代码中),而是将其移动到末尾(好像它是由 Tidy 本身添加的)。
我已经测试了卫报首页和一些新闻/专栏页面,同样的问题。在我的测试中,此配置适用于 BBC 或其他网站,至少我不希望它返回空body
或移动结束head
标签。
谁能弄清楚为什么?
PS:我的整洁发布版本是 25 March 2009
,据我所知,这是最新版本。
Sourceforge 上的 Tidy 票证系统中有一个功能请求,请求支持 HTML5。卫报页面使用的是HTML5。
另一方面,我想说Tidy不再被积极开发了。所有提交到 CVS 存储库中都是几年前的,最新的提交是在 21 个月前的实验目录中,改变了 HTML5 的一些内容。Github上还有一个分支,最后一次提交是在一年前。https://github.com/w3c/tidy-html5 你可以尝试编译这个。