如何将CSV文件从S3桶复制到Redshift并避免重复行?我读过关于复制命令,但没有找到任何关于通过PHP SDK使用它的文档。
PHP SDK设计用于运行管理任务(与Web控制台相同)。
为了加载数据,只需使用PostgreSQL连接器连接到数据库并运行COPY查询。
避免重复行是另一个问题-目前红移不强制UNIQUE约束,所以源文件中存在的任何行都将被添加到目标表中(即使相同的UNIQUE值已经存在)。
文档给出了一些如何只导入新行的提示,如:
-
插入新数据:
INSERT INTO dest_table (
SELECT * from temp_table
WHERE key NOT IN (
SELECT key FROM dest_table
)
)