我使用 Goutte/Symfony2 抓取网络,我的过滤器有问题,
我在爬虫(网络的一部分)$msg,如果我打印 html,我可以在 $msg 个类为 .mola 的div 中看到,为什么如果我过滤$msg以获取文本 .mola 我得到The current node list is empty
?
$msg = '<div class="mola_wrap">
<span class="mola" title="titleinside">109</span>'; // in $msg are more code
$msg->filter('.mola')->text();
谢谢!!
假设$msg是一个包含此html的爬虫对象
<div class="mola_wrap">
<span class="mola" title="titleinside">109</span>
</div>
您的代码很好,也许您正在抓取的网站在某些页面中没有 .mola 类