如何使用PHP解析具有多个xml声明的xml文件?(多个 XML 文件的串联)


How to parse an xml file with multiple xml declaration using PHP? (A concatenation of several XML files)

xml的格式:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE >
<root>
 <node>
  <element1></element1>
  <element2></element2>
  <element3></element2>
  <element4></element3>  
</node>
</root>
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE >
<root>
 <node>
  <element1></element1>
  <element2></element2>
  <element3></element2>
  <element4></element3>  
</node>
</root>

以及之后的几个 XML 声明。顺便说一句,文件大小为500MB。我想寻求帮助,如何使用 PHP 解析此文件而不将其分解为不同的文件。

任何帮助将不胜感激。谢谢。。

如果您不想拆分文件,则必须在内存中使用它。鉴于您的 500MB 文件大小,这可能会出现问题。无论如何,一种选择是从所有文档中删除XML Prolog和DocType,然后像这样加载整个内容:

$dom = new DOMDocument;
$dom->loadXML(
    sprintf(
        '<?xml version="1.0" encoding="UTF-8"?>%s' .
        '<!DOCTYPE >%s' . 
        '<roots>%s</roots>',
        PHP_EOL, 
        PHP_EOL, 
        str_replace(
            array(
                '<?xml version="1.0" encoding="UTF-8"?>', 
                '<!DOCTYPE >'
            ),
            '',
            file_get_contents('/path/to/your/file.xml')
        )
    )
);

这将使它成为一个只有 XML prolog 和一个 DocType 的巨大 XML 文件(注意,我假设文件中所有文档的 DocType 都是相同的)。然后,您可以通过循环访问各个根元素来处理该文件。