使用SimpleXML和xpath访问XML节点值


Accessing XML node value using SimpleXML and xpath

有很多这样的问题,所以原谅我。我都读过了。

我有以下XML文档,使用名称空间http://www.columbasystems.com/cpng/xmlviewer/cal/1-0/: http://events.manchester.ac.uk/f3vf/calendar/tag:manchester_museum/view:list/p:q_details/calml.xml

我正在尝试使用SimpleXML解析这个文档。下面的示例代码尝试从下面访问标题节点"Discovery Center"的值。

<ns:calendar xmlns:ns="http://www.columbasystems.com/cpng/xmlviewer/cal/1-0/">
    <ns:listView>
    <ns:day date="2015-07-08" weekDay="Wed">
    <ns:event>
    <ns:id xmlns:even="http://www.columbasystems.com/customers/uom/gpp/eventid/" query="{http://www.columbasystems.com/customers/uom/gpp/eventid/}b9v-ib270yqf-nmn54k">even:b9v-ib270yqf-nmn54k</ns:id>
    <ns:title>Discovery Centre</ns:title>
    ...
</ns:event>
</ns:day>
</ns:listView>
</ns:calendar>

PHP:

$feed_uri = 'http://events.manchester.ac.uk/f3vf/calendar/tag:manchester_museum/view:list/p:q_details/calml.xml';
$xml = simplexml_load_file($feed_uri);
$xml->registerXPathNamespace("ns", "http://www.columbasystems.com/cpng/xmlviewer/cal/1-0/");
foreach($xml->xpath('//ns:calendar/ns:listView/ns:day') as $day) {
    $events = $day->xpath('//ns:event');
    foreach($events as $event) {
        var_export($event->xpath('//ns:title'));
    }
}

输出多个空数组:

array ( 0 => SimpleXMLElement::__set_state(array( )),

我认为我使用xpath错误,我如何得到这样的节点值?

您的输出不是一个空数组。一个空数组看起来像这样:

array()

但是你有这个:

array ( 0 => SimpleXMLElement::__set_state(array( )),

因此,很明显XPath正在工作,并为您提供结果列表(数组)(SimpleXMLElement对象)。

问题是var_export不擅长检查SimpleXMLElement对象,因此您无法看到实际得到的结果。

要获得节点的文本内容,必须将其强制转换为字符串—显式地使用(string)$node,或隐式地使用echo。所以下面的代码可以工作:

foreach($xml->xpath('//ns:calendar/ns:listView/ns:day') as $day) {
    $events = $day->xpath('//ns:event');
    foreach($events as $event) {
        foreach ($event->xpath('//ns:title') as $title ) {
            echo $title;
        }
    }
}

但是,XPath表达式中确实有一个小错误(与是否使用SimpleXML或任何其他API无关)://前缀总是从文档的根开始,而不是用作上下文的元素。要搜索"当前元素内的任意深度",你需要.//,例如$day->xpath('.//ns:event')

也就是说,在这里实际上根本不需要像XPath那样花哨的东西,因为它不是一个很深的结构。因此,只要您首先使用->children()方法选择正确的名称空间,就可以使用SimpleXML的普通访问方法:

$cal_items = $xml->children("http://www.columbasystems.com/cpng/xmlviewer/cal/1-0/");
foreach($cal_items->listView->day as $day) {
    foreach($day->event as $event) {
        echo $event->title;
    }
}

请注意,您的XML包含没有名称空间前缀的属性,如<ns:day date="2015-07-09" weekDay="Thu">;有些不直观的是,这些名称空间根本没有正式名称空间,所以您必须切换回空名称空间才能访问它们:

echo $day->attributes(null)['date'];

我把xml放在字符串中,改回文件。我希望,其他是清楚的

$str = '<ns:calendar xmlns:ns="http://www.columbasystems.com/cpng/xmlviewer/cal/1-0/">
    <ns:listView>
    <ns:day date="2015-07-08" weekDay="Wed">
    <ns:event>
    <ns:id xmlns:even="http://www.columbasystems.com/customers/uom/gpp/eventid/" query="{http://www.columbasystems.com/customers/uom/gpp/eventid/}b9v-ib270yqf-nmn54k">even:b9v-ib270yqf-nmn54k</ns:id>
    <ns:title>Discovery Centre</ns:title>
</ns:event>
</ns:day>
</ns:listView>
</ns:calendar>';
$xml = simplexml_load_string($str);
$xml->registerXPathNamespace("ns", "http://www.columbasystems.com/cpng/xmlviewer/cal/1-0/");
foreach($xml->xpath('//ns:calendar/ns:listView/ns:day') as $day) {
    echo $day['date'] . ' ';
    $events = $day->xpath('.//ns:event');
    foreach($events as $event) {
        echo $event->xpath('.//ns:title/text()')[0];
    }
}
结果

2015-07-08 Discovery Centre

您可以使用前缀代替完整url。记住如何获取属性值在这里是

$cal_items = $xml->children("ns",true);
foreach($cal_items->listView->day as $day) {
    echo $day->attributes()['date'] . ' ' ;
    foreach($day->event as $event) {
        echo $event->title;
    }
}