一个很好的性能替代PHP-字符串/文件操作


A good performance alternative to PHP - String/File Manipulation

我有一个项目已经完成,但需要更好的性能。

该项目的要点是,我将使用XML并将其转换为CSV文件。这些文件表示要加载到数据库中的数据。

现在我正在使用PHP来解压缩包含XML的zip文件。然后我解析,转换为CSV,然后重新压缩。

到目前为止一切都很好,但XML文件现在变得越来越庞大。如此之多,以至于处理需要一天多一点的时间。我还在那里对文件进行一些操作,比如重新排列列和修剪。

你建议哪些替代方案可以帮助我提高绩效?

我曾想过用C++编写这个解析器,但我不确定该走哪条路。有人问过类似的问题,但我想这更多的是一个性能问题。我是否应该为了性能而切换语言,坚持使用PHP并优化它,是否应该尝试使这个解析器并行,以便一次可以处理多个文件?

你有什么建议?

如果PHP不能提供您所没有的,您应该尝试Perl,但我怀疑,也许您在那里(逻辑上)做错了什么。

您使用的是哪种XML解析器?(最好是SAX…)。

此外,如果能看到一些代码(如何解析XML…)

也会很好