我怎样才能删除<br/>如果在它之前或之后没有文本?DOMxpath或regex


How can I remove <br/> if no text comes before or after it? DOMxpath or regex?

如果之前或之后没有文本,我如何删除<br/> ?

例如,

<p><br/>hello</p>
<p>hello<br/></p>

应该这样重写,

<p>hello</p>
<p>hello</p>

我应该使用DOMxpath还是regex会更好?

(注意:我之前有一篇关于用DOMxpath删除<p><br/></p>的文章,然后我遇到了这个问题!)

编辑:

如果我在输入中有这个

$content = '<p><br/>hello<br/>hello<br/></p>';

那么应该是

<p>hello<br/>hello</p>'

要选择上述br,可以使用:

 "//p[node()[1][self::br]]/br[1] | //p[node()[last()][self::br]]/br[last()]"

或者(可能)更快:

 "//p[br]/node()[self::br and (position()=1 or position()=last())]"

当p的第一个(或最后一个)节点是br时才得到br。

这将选择br,例如:

<p><br/>hello</p>
<p>hello<br/></p>

和第一个和最后一个br,如in:

<p><br/>hello<br/>hello<br/></p>

不像in:

<p>hello<br/>hello</p>

PS:最终得到像这样的一对中的第一个br <br/><br/>:

"//br[following::node()[1][self::br]]"

对于一些代码,我可以让它像这样工作(Demo)。它对@empo的xpath做了一点修改(非常小),并显示了匹配的删除以及一些更多的测试用例:

$html = <<<EOD
<p><br/>hello</p>
<p>hello<br/></p>
<p>hello<br/>Chello</p>
<p>hello <i>molly</i><br/></p>
<p>okidoki</p>
EOD;
$doc = new DomDocument;
$doc->loadHTML($html);
$xpath = new DomXPath($doc);
$nodes = $xpath->query('//p[node()[1][self::br] or node()[last()][self::br]]/br');
foreach($nodes as $node) {
    $node->parentNode->removeChild($node);
}
var_dump($doc->saveHTML());