是否可以从八位字节流解析驻留在嵌套 zip 存档中的 XML 文件


Is it possible to parse an XML file that resides within a nested zip archive from an octet-stream?

我正在使用伦敦交通局 (TFL) - 旅程规划时间表 API 从八位字节流中获取stream.zip。此存档中还有三个压缩目录;只有一个目录对我有用 - 其中驻留了许多我想解析到数据库中的 XML 文件。

因为我需要能够定期更新数据库 - 至少 10 分钟 - 所以我希望避免将 stream.zip 下载到磁盘,而是读取和提取必要的数据。

Stream.zip的结构是这样的:

  • 流.zip
    • 巴士第一部分.zip
    • 巴士第二部分.zip
    • lultramdlrcablecarriver.zip (其中驻留了我想解析的XML文件。

诚然,我是使用流的新手,并希望保持简单,但我觉得有一种更聪明(更少浪费)的方式来使用这些 XML 文件。

请问有流经验的人可以列出实现上述目标所涉及的步骤吗?我只是在追求一些方向。我很高兴然后去读书。

非常感谢。

如果您唯一可以访问的是流.zip,则无法仅读取其中的特定部分。您的服务器在打开文件之前需要完整文件。