去掉xml前的换行符留下空格——正确的方法是什么?


Stripping line breaks pre-XML leaves spaces- what is the proper method?

我想知道从xml目的PHP字符串中删除换行符的建议方法。使用下面的方法,我在XML标记之间留下了变化的2-4个空格。

$current = $xml->saveXML();
$current = str_replace(array("'r'n", "'r", "'n"), "", $current);

删除换行符的正确语法是什么,这样XML标记就会端到端出现,而不会在它们之间添加空格?

首先是一些基本的事情:$xml->saveXML()建议您使用SimpleXML。它只在输出中使用一个行分隔符:"'n"

说明搜索"'r'n""'r"是错误的。使用str_replace()也不是一个好主意,你应该使用strtr()代替:

$current = strtr($current, array("'n" => ''));

由于这个只替换了换行符,所以XML元素之间的空格字符在这里不会被删除或更改。

然而,这些空格字符在很大程度上取决于您的输入XML。在XML中,您可以有重要的(删除它将是一个失败)和非重要的空白(保存以删除),但SimplexmlDOMDocument不(也不能)知道哪个是哪个。

由于图书馆本身不知道,你需要告诉他们。例如,看起来您正在寻找所有文本节点的修剪。由于SimpleXMLElement不允许访问文本节点,因此需要使用DOMXPath。不过别担心,事情没那么复杂:

$doc   = dom_import_simplexml($xml)->ownerDocument;
$xpath = new DOMXPath($doc);
foreach ($xpath->query('//text()') as $text) {
    $text->data = trim($text->data);
}

这只是按文档顺序遍历所有文本节点并修剪它们。

那么您只需要获得以文档元素开头的XML。这将剥离xml声明和前面的任何注释和处理指令(我假设您需要这些):

$current = $doc->saveXML($doc->documentElement);

如果没有,则应用上面的行分隔符规则。然后你可以:

$current = $xml->saveXML();
$current = strtr($current, array("'n" => ''));

就是这样。