加载简单 XML 时出错


Error Loading Simple XML

我有一个xml文档(从msword 2010生成),我正在尝试使用简单的xml来处理它。

xml示例:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<w:document xmlns:wpc="http://schemas.microsoft.com/office/word/2010/wordprocessingCanvas" xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships" xmlns:m="http://schemas.openxmlformats.org/officeDocument/2006/math" xmlns:v="urn:schemas-microsoft-com:vml" xmlns:wp14="http://schemas.microsoft.com/office/word/2010/wordprocessingDrawing" xmlns:wp="http://schemas.openxmlformats.org/drawingml/2006/wordprocessingDrawing" xmlns:w10="urn:schemas-microsoft-com:office:word" xmlns:w="http://schemas.openxmlformats.org/wordprocessingml/2006/main" xmlns:w14="http://schemas.microsoft.com/office/word/2010/wordml" xmlns:wpg="http://schemas.microsoft.com/office/word/2010/wordprocessingGroup" xmlns:wpi="http://schemas.microsoft.com/office/word/2010/wordprocessingInk" xmlns:wne="http://schemas.microsoft.com/office/word/2006/wordml" xmlns:wps="http://schemas.microsoft.com/office/word/2010/wordprocessingShape" mc:Ignorable="w14 wp14">
<w:body>
    <w:p w:rsidR="005B1098" w:rsidRDefault="005B1098"/>
    <w:p w:rsidR="00F254A4" w:rsidRDefault="00F254A4"/>
    <w:p w:rsidR="00F254A4" w:rsidRPr="008475A1" w:rsidRDefault="00C15492" w:rsidP="008475A1">
        <w:pPr>
            <w:jc w:val="center"/>
            <w:rPr>
                <w:b/>
                <w:sz w:val="44"/>
                <w:szCs w:val="44"/>
            </w:rPr>
        </w:pPr>
        <w:r w:rsidRPr="008475A1">
            <w:rPr>
                <w:b/>
                <w:sz w:val="44"/>
                <w:szCs w:val="44"/>
            </w:rPr>
            <w:t>Test file</w:t>
        </w:r>
    </w:p>
    <w:p w:rsidR="00C15492" w:rsidRPr="008475A1" w:rsidRDefault="00C15492" w:rsidP="008475A1">
        <w:pPr>
            <w:jc w:val="center"/>
            <w:rPr>
                <w:sz w:val="20"/>
                <w:szCs w:val="20"/>
            </w:rPr>
        </w:pPr>
        <w:r w:rsidRPr="008475A1">
            <w:rPr>
                <w:sz w:val="20"/>
                <w:szCs w:val="20"/>
            </w:rPr>
            <w:t>another paragraph</w:t>
        </w:r>
    </w:p>
</w:body>
</w:document>

我正在尝试使用以下方法打开它:

$content = '/reports/docx_templates/testing2.xml';
if(!$simple_xml = simplexml_load_file($content)){
    trigger_error('Error reading XML file',E_USER_ERROR);
} else {
    echo 'loaded';
}

并得到错误:

Message: simplexml_load_file(): I/O warning : failed to load external entity " Test file another paragraph "

有什么想法吗?

我更喜欢 SimpleXMLElement Class。

$xml = new SimpleXMLElement(file_get_contents($content));

我已经用您的XML文件及其工作对其进行了测试。

编辑:

下面是解析 Word XML 文件的简短教程:Word XML

我认为PHP的XML解析器有些不太正确。

http://schemas.openxmlformats.org 不会转到有效的网址。但它不必这样做,因为 XML 命名空间规则不坚持这样做。但是,请看此页面

https://bugs.php.net/bug.php?id=60416

并且您看到有人设法通过命名空间上的混乱来解决您的问题。

我怀疑您的原始问题显示的内容可能是成功运行代码,但带有您使用trigger_error强制的错误消息。

这太长了,无法发表评论。

这不是一个真正的答案,所以这里有一个建议来弥补它......

将 xml 另存为 testing2.xml 在与 php 文件相同的目录中运行此代码。

<?php
if (file_exists('testing2.xml')) {
    $content = file_get_contents('testing2.xml');
    $xml = new SimpleXMLElement($content );
    echo "<pre>";        
    var_dump($xml );
    echo "</pre>"; 
} else {
    exit('Failed to open testing2.xml.');
}