使用php从S3复制数据到redshift


copy data from S3 to redshift using php

如何将CSV文件从S3桶复制到Redshift并避免重复行?我读过关于复制命令,但没有找到任何关于通过PHP SDK使用它的文档。

PHP SDK设计用于运行管理任务(与Web控制台相同)。

为了加载数据,只需使用PostgreSQL连接器连接到数据库并运行COPY查询。

避免重复行是另一个问题-目前红移不强制UNIQUE约束,所以源文件中存在的任何行都将被添加到目标表中(即使相同的UNIQUE值已经存在)。

文档给出了一些如何只导入新行的提示,如:

  1. 插入新数据:

INSERT INTO dest_table (
  SELECT * from temp_table
  WHERE key NOT IN (
    SELECT key FROM dest_table
  )
)