我正在制作一个管理面板,在那里会显示实时推文,在管理员批准后,网站上只会显示批准的推文,获取部分已经完成,我做了一个cron工作,所以每1小时后,我的脚本就会从推特中获取最新推文并保存在DB中。问题来了,如果我的第一批运行并在1小时后保存在数据库中,会出现新的结果(不确定是否有新的)或所有新的结果,但重复的结果会保存在数据库上,我不想这样做。如何在每1小时后停止将重复的推文保存到数据库。为此,我使用了php、mysql。
您可以在DB中保留hash
字段,它代表函数md5($author.$tweet.$datetime)
。当cron任务开始处理时,通过hash
字段检查列表中的每条tweet是否与DB中的记录匹配。