如何在不再次查询整个文档的情况下查询子元素的xpath结果?
我查询我的文档以查找menu-item
:类的最后一个<li>
$doc = new DomDocument();
@$doc->loadHTML( $html );
// $html is invalid (and should be at this point),
// so use @ sign to suppress errors
$xpath = new DomXPath( $doc );
$li = $xpath->query( "(//li[contains(concat(' ', normalize-space(@class), ' '), 'menu-item')])[last()]" )->item( 0 );
上面的工作原理很好,现在我想查询$li
以找到以下内容:
$p = $xpath->query( "//p[contains(concat(' ', normalize-space(@class), ' '), 'field-description')]" )->item( 0 );
类为field-description
的p
标记。这不起作用,并返回找到的第一个实例,如果我修改它并使用[last()]
(不管是什么),那么它就起作用了,但它不一定是这里的最佳解决方案:
$p = $xpath->query( "(//p[contains(concat(' ', normalize-space(@class), ' '), 'field-description')])[last()]" )->item( 0 );
上面的行有效,但我想再次查询$li
内部而不是整个文档。
query
的第二个参数是contextnode
,它将搜索限制在该节点内。但是,如果使用绝对xpath,query
仍然会返回整个文档的节点。
php > $dd = new DomDocument();
php > // deliberately using malformed html.
php > $dd->loadhtml('<html><head><title>wat</title></head><body><div>Hello, <p>world</p></div><div class="container"><p>I like pie</div></body></html>');
php > $xp = new DomXPath($dd);
php > $container = $xp->query('//div[@class="container"]')->item(0);
php > var_dump($xp->query('//p'));
class DOMNodeList#6 (1) {
public $length =>
int(2)
}
php > var_dump($xp->query('//p', $container));
class DOMNodeList#4 (1) {
public $length =>
int(2)
}
php > var_dump($xp->query('p', $container));
class DOMNodeList#5 (1) {
public $length =>
int(1)
}
您可以使用类似.//x
的模式在上下文节点内递归地匹配所有x
元素。(HT:Alf Eaton)