xml的格式:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE >
<root>
<node>
<element1></element1>
<element2></element2>
<element3></element2>
<element4></element3>
</node>
</root>
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE >
<root>
<node>
<element1></element1>
<element2></element2>
<element3></element2>
<element4></element3>
</node>
</root>
以及之后的几个 XML 声明。顺便说一句,文件大小为500MB。我想寻求帮助,如何使用 PHP 解析此文件而不将其分解为不同的文件。
任何帮助将不胜感激。谢谢。。
如果您不想拆分文件,则必须在内存中使用它。鉴于您的 500MB 文件大小,这可能会出现问题。无论如何,一种选择是从所有文档中删除XML Prolog和DocType,然后像这样加载整个内容:
$dom = new DOMDocument;
$dom->loadXML(
sprintf(
'<?xml version="1.0" encoding="UTF-8"?>%s' .
'<!DOCTYPE >%s' .
'<roots>%s</roots>',
PHP_EOL,
PHP_EOL,
str_replace(
array(
'<?xml version="1.0" encoding="UTF-8"?>',
'<!DOCTYPE >'
),
'',
file_get_contents('/path/to/your/file.xml')
)
)
);
这将使它成为一个只有 XML prolog 和一个 DocType 的巨大 XML 文件(注意,我假设文件中所有文档的 DocType 都是相同的)。然后,您可以通过循环访问各个根元素来处理该文件。