我有一个项目已经完成,但需要更好的性能。
该项目的要点是,我将使用XML并将其转换为CSV文件。这些文件表示要加载到数据库中的数据。
现在我正在使用PHP来解压缩包含XML的zip文件。然后我解析,转换为CSV,然后重新压缩。
到目前为止一切都很好,但XML文件现在变得越来越庞大。如此之多,以至于处理需要一天多一点的时间。我还在那里对文件进行一些操作,比如重新排列列和修剪。
你建议哪些替代方案可以帮助我提高绩效?
我曾想过用C++编写这个解析器,但我不确定该走哪条路。有人问过类似的问题,但我想这更多的是一个性能问题。我是否应该为了性能而切换语言,坚持使用PHP并优化它,是否应该尝试使这个解析器并行,以便一次可以处理多个文件?
你有什么建议?
如果PHP不能提供您所没有的,您应该尝试Perl,但我怀疑,也许您在那里(逻辑上)做错了什么。
您使用的是哪种XML解析器?(最好是SAX…)。
此外,如果能看到一些代码(如何解析XML…)