用DOMDocument替换HTML中的Tag


Replace Tag in HTML with DOMDocument

我正在尝试用php中的DOMDocument::loadHTML编辑html标记。html数据是html的一部分,而不是整个页面。我遵循了这个页面(PHP-DOMDocument-需要用新标签更改/替换现有的HTML标签)所说的内容。

这应该将pre标记转换为div标记,但它给出了"致命错误:未捕获异常'DOMException',并显示消息'Not Found error'。"

<?php
$contents = <<<STR
<pre>hi</pre>
<pre>hello</pre>
<pre>bye</pre>
STR;
$dom = new DOMDocument;
@$dom->loadHTML($contents);
foreach( $dom->getElementsByTagName("pre") as $nodePre ) {
    $nodeDiv = $dom->createElement("div", $nodePre->nodeValue);
    $dom->replaceChild($nodeDiv, $nodePre);
}
echo $dom->saveHTML();
?>

[编辑]当我试图向后迭代节点对象时,我得到了这样的错误,"注意:正在尝试获取非对象的属性…"

<?php
$contents = <<<STR
<pre>hi</pre>
<pre>hello</pre>
<pre>bye</pre>
STR;
$dom = new DOMDocument;
@$dom->loadHTML($contents);
$domPre = $dom->getElementsByTagName('pre');
$length = $domPre->length;
    For ($i = $length; $i > -1 ; $i--) {
        $nodePre = $domPre->item($i);
        echo $nodePre->nodeValue . '<br />';
//      $nodeDiv = $dom->createElement("div", $nodePre->nodeValue);
//      $dom->replaceChild($nodeDiv, $nodePre);
    }
    // echo $dom->saveHTML();
?>

[编辑]好了,解决了。由于回答的代码有一些错误,我在这里发布了解决方案。谢谢大家。

解决方案:

<?php
$contents = <<<STR
<pre>hi</pre>
<pre>hello</pre>
<pre>bye</pre>
STR;
$dom = new DOMDocument;
@$dom->loadHTML($contents);
$domPre = $dom->getElementsByTagName('pre');
$length = $domPre->length;
For ($i = $length - 1; $i > -1 ; $i--) {
    $nodePre = $domPre->item($i);
    $nodeDiv = $dom->createElement("div", $nodePre->nodeValue);
    $nodePre->parentNode->replaceChild($nodeDiv, $nodePre);
}
echo $dom->saveHTML();
?>

问题在于对replaceChild()的调用。而不是

$dom->replaceChild($nodeDiv, $nodePre);

使用

$nodePre->parentNode->replaceChild($nodeDiv, $nodePre);

更新

这是一个工作代码。替换多个节点似乎存在一些问题(更多信息请点击此处:http://php.net/manual/en/domnode.replacechild.php)因此,您将不得不使用回归循环来替换元素。

$contents = <<<STR
<pre>hi</pre>
<pre>hello</pre>
<pre>bye</pre>
STR;
$dom = new DOMDocument;
@$dom->loadHTML($contents);
$elements = $dom->getElementsByTagName("pre");
for ($i = $elements->length - 1; $i >= 0; $i --) {
    $nodePre = $elements->item($i);
    $nodeDiv = $dom->createElement("div", $nodePre->nodeValue);
    $nodePre->parentNode->replaceChild($nodeDiv, $nodePre);
}

paquettg/php-html解析器的另一种方法(没有找到更改名称的方法,所以不得不使用重新绑定$this的破解):

use PHPHtmlParser'Dom;
use PHPHtmlParser'Dom'HtmlNode;
$dom = new Dom;
$dom->load($text);
/** @var HtmlNode[] $tags */
foreach($dom->find('pre') as $tag) {
    $changeTag = function() {
        $this->name = 'div';
    };
    $changeTag->call($tag->tag);
};
echo (string)$dom;