经常使用PHP解析和存储文本


Frequently Parsing and Storing text with PHP

我正在创建一个php脚本,该脚本使用正则表达式解析一个文本字符串,通常为500-750个字符,以找到5-6个子字符串。提取的信息被稍微处理一下,然后存储在数据库中。一旦实现,脚本将在一天中平均每隔几秒钟执行一次。一个普通的Web服务器能够处理这种级别的使用吗?我不确定这种类型的脚本在执行频率下会占用多大的内存。

我在思考减少服务器负载的可能方法,并想出了一个我不确定是否更好的主意。我可以将原始文本存储在数据库中,以便稍后进行解析,而不是在收到原始文本时立即对其进行解析。一整天,我都可以让服务器在网站流量较低的时期以可管理的数量处理信息。如果这是一个解决方案,下面的算法是一个好的方法吗?

  1. 从数据库中选择一些尚未解析的文本记录
  2. 从文本中提取信息并将其添加到数据库
  3. 更新文本记录以表明它们已被解析
  4. 使用<meta http-equiv="refresh">重新加载脚本
  5. 重复x次

任何关于如何处理这一问题的建议都将不胜感激,谢谢!

根据您的描述,它对服务器的要求似乎不是很高。

我建议实现最简单的解析和存储数据的解决方案。然后向这段代码提供数据负载并测量吞吐量。这可以让你知道处理记录的速度有多快。

在此之后,您可以估计这种简单的方法是否足够。