获取不在属性为 X 的节点内的 html 节点


Get html nodes that are not within a node with attribute X

我有以下 xpath 查询,我不确定如何做到这一点,以便它只找到具有属性的项目 pi-repeat ,而不是具有该属性的子项。

$xpath = new DOMXPath($dom);
foreach ($xpath->query('//*[@pi-repeat]') as $node) {
    // Do stuff
}

网页示例:

<body>
    <div pi-repeat="thing1">
        <div pi-repeat="sub-item"></div>
    </div>
    <div class="a-class">
        <div pi-repeat="thing2">
            <div pi-repeat="sub-item"></div>
        </div>
    </div>
</body>

正如您在这里看到的,有四个pi-repeat属性,我希望我的查询只选择不在元素pi-repeat属性中的属性。

在这种情况下,只会选择thing1thing2

下面 XPath 中的第二个谓词将完成这项工作。它过滤掉祖先元素具有pi-repeat属性的元素:

//*[@pi-repeat][not(ancestor::*[@pi-repeat])]