如何在使用get内容后过滤数据


How to filter data after using get contents

我想知道如何在远程网站上找到一个数字并使其成为一个变量。

例如,如果我想找到"AMZN"的股票报价,我会使用curl或在页面上获取内容http://stock-quotes.com/AMZN"使其成为一个名为$contents 的变量字符串

既然我有了$contents,我该如何找到AMZN的报价?我想用一个正则表达式来缩小这条线,比如找到"AMZN=35点",然后执行另一个函数来删除字符串开头和结尾的"AMZN="answers"点",这样就只剩下"35"了。

人们就是这样做的吗?

1.)DOM元素

2.)简单的XML

3.)预匹配

4.)strpos

我一直在做的事情(比如在spidering等中)是在PHP中使用simple_html_dom库,然后检查站点的标记。

如前所述,缺点是,如果标记发生变化,您将需要修改代码,但通常这相当容易,如果您使用的源代码具有信息标记(所需元素上的一致类名等),则会更容易。

库链接:http://simplehtmldom.sourceforge.net/