JSON和XML的YQL解析问题


YQL parsing issue with both JSON and XML

我正在尝试使用 YQL 解析页面。正在解析 HTML 表。问题是YQL本身添加了HTML "p"标签,而它不包含在原始HTML中。应该怎么做才能使 YQL 不应该返回 HTML。

可以在此处查看 YQL 查询。

如果在下面这样的td标签中查看,则包含一个p标签,而原始html中可以看到此处在表格html中没有p标签。

<tr>
    <td class="ttl">
        <a href="#" onclick="helpW('h_weight.htm');">Weight</a>
    </td>
    <td class="nfo">
        <p>169 g</p>
    </td>
</tr>

这不是YQL做的,而是HTML5引擎本身。HTML5 的部分理念是,如果您为其提供无效的 HTML,它会通过添加您错过的任何元素来为您修复它,您在查询中看到的是表示修复内容的树。(是的,这使得编写查询变得困难。但这不是一个分配责任的地方...