使用抓取和if/else命令构建web应用程序


Building web app using scraping and if/else commands

我正在尝试构建一个web应用程序,它应该相当简单,但由于我试图包含一个抓取操作,它变得复杂。

我试图实现的是:

客户访问该网站,会收到一个文本框,在其中输入汽车的车牌号。这将返回特定维修的价格。

我想通过将车牌号添加到下面的URI来实现这一点(在本例中,1-KBB-00是车牌号)。

https://www.finnik.nl/autorapport/1-KBB-00

这个url返回一个网页,其中有一个大表,列出了属于这辆车的各种规格。我要找的是:

 Aantal versnellingen 

在本例中其值为"5"。在属于上述URI的网站上,这看起来像:

<tr>
<th scope="row" class="col-sm-8">
          Aantal versnellingen
        </th>
<td>
5
</td>
</tr>

对于几乎所有的汽车,这个值将是5或6。我希望脚本抓取或获取这个值,然后应用if/else命令来显示价格。如果值为5,则价格为"X",如果值为6,则价格是"Y",并且如果值不是5或6,则脚本将返回一条错误消息,告诉客户联系公司以获得报价。

现在我可以自己实现脚本的if/else部分,将许可证附加到url也不应该是问题,但当涉及到从该表中抓取数据时,我不知所措。

我曾乐观地尝试使用"get"命令,但不出所料,它没有起作用。我在谷歌上搜索了一下,但我一直没能找到合适的解决方案,我的一部分在想这是否可能。然而,我看不出有任何理由不这样做,所以我们非常感谢任何帮助!

注意:我正在工作的网站是建立在Wordpress上的,所以任何解决方案都必须与Wordpress兼容。

似乎有几个WordPress插件形式的选项:

  • WP卷筒纸刮刀
  • Supra刮刀

如果这两种方法都不起作用,您可以使用PHP将某些东西组合在一起。

有几个库:

  • Goutte
  • 简单HTML DOM分析器

最后,另一个选择是完全从头开始滚动自己的页面,按照这个路线,你可以使用cURL来检索页面。一旦你有了HTML,你就可以使用正则表达式来找到你想要的数据。