如您所见,XML节点"description"包含转义的HTML,我需要提取第一个img的src属性。 有没有办法用XPath做到这一点?
<item>
<description><img class="imagefield imagefield-field_teaser_astory" width="481" height="455" alt="" src="http://www.rightwingwatch.org/sites/default/files/images/a_story_rww/roundup_A_.jpg?1383082488" /> Is Trump Going To Run The Country The Way He&rsquo;s Running This Convention?</description>
</item>
您可以使用基本的子字符串函数:
substring-before(substring-after(/item/description/text(), 'src="'), '"')
这将按文档顺序在第一个/item/description
文本节点中查找 src="
和 "
之间的所有文本。