将 id 添加到解析器 html 元素


Add id to parser html element?

我将编写一个从 soccerway.com 中提取数据的工具。事实上,我要创造一种历史。

如您所见,数据被分组到足球赛季中,因此会有数据库2015/2016, 2016/2017等等。然后,我要做的是获取数据,将它们输入到数据库中,然后运行一个 cron 作业来更新这些值。问题是我应该对他们有一个关键识别来升级或其他东西。我目前只考虑解析器的操作,但我不知道如何为每个项目解析器创建一个键。例如,从我提供给您的链接中获取联赛排名,我如何(一旦输入数据),将来与 cronjob 一起检查是否有更新并替换值?我知道是否有更新可以利用字段lastUpdate标头并将其保存在数据库中的某个位置,然后cronjob将检查每个联赛的此字段。但是,最重要的一点是识别要更新的值,因为我没有要引用的 id。

一些想法?

在解析数据时,您可以存储即将到来的比赛的日期和时间,并将脚本设置为运行(在此期间不会更新)。如果你直接解析HTML代码,应该不会花很长时间。