网页抓取 - 如何使用 PHP Simple HTML DOM 解析器获取 javascript 标签中的文本


web scraping - How to get text inside javascript tag using PHP Simple HTML DOM Parser

示例:

<script>
var TEST = { "contextData" :
{id:01,title:one},{id:02,title:two},{id:03,title:three}}
</script>

如何获得所有标题? 使用PHP简单HTML DOM解析器,我只是不知道这样做。

以下内容未经测试,但应该可以工作:

  • 使用 $script = $html->find('script', 0); 获取脚本
  • 使用以下模式,按照 @pguardiario 的建议进行preg_match_all,以获取标题值:/title's*:'s*([^}]+)/

演示

编辑:

要获得所有标题和描述(与qwerty不同),请将模式修改为:/(title|desc)'s*:'s*(?!qwerty)([^},]+)/

演示