我正在网页上爬行html,当我使用php strip_tags时,它会将整个html挤成一行,删除所有结构。
我想通过用换行符替换结束的h, p和br标记来保持结构。
孕替代品是最好的解决方案吗?
一旦我替换了所有的结束标签,我将运行一个条带标签,但这样我将有一个基本的结构。
$str = 'some html';
$tags = array('</p>','<br />','<br>','<hr />','<hr>','</h1>','</h2>','</h3>','</h4>','</h5>','</h6>');
$str = str_replace($tags,"'n",$str);
// then strip tags
为什么不通过整洁的后记来运行它以恢复结构呢?