使用书签进行网页抓取 - 从页面的jQuery弹出窗口中获取HTML


web-scraping with bookmarklet - getting the html from a jquery popup window from a page

site: freepeople.com/clothes/

当我单击页面下方"此类别中的顶级样式"下的任何项目时,会出现一个弹出窗口,其中包含产品图片和价格。

使用我在PHP和JS中创建的书签,如何捕获此弹出窗口的HTML?

弹出窗口是通过 AJAX 加载的,这意味着您需要进行另一个 http 调用(在 php 中)才能在弹出窗口中获取信息。在 freepeople.com/clothes/的情况下,该网站已经努力支持较旧的浏览器,因此链接也是实际的链接,而不仅仅是javascript ajax调用,因此您可以忽略ajax,只需遵循链接本身。

尝试查看禁用了javascript的网站。

例如,如果您按下表格中的第一个链接(在发布帖子时),您将到达/cmCategoryID/8a61524b-907c-474c-ab37-f357c9ae11e3/&detailcross/?

=1359375343410">http://www.freepeople.com/Big-Dipper-Oversized-Tee//cmCategoryID/8a61524b-907c-474c-ab37-f357c9ae11e3/&detailcross/?=1359375343410 .