我正在 S3 存储桶 list 上运行 SELECT Athena 查询。然后,我想在 S3 批处理操作中以 .csv 格式使用该查询的结果。
我的查询运行良好,我能够通过 S3 Batch 访问 .csv 输出,但由于第一行实际上是列标题,S3 Batch 会抛出不可恢复的错误,因为它认为 list 现在指的是多个存储桶。
如何轻松地从结果中去除列标题?我宁愿只用 SQL 来做。文件大小使得使用标准 unix 工具望而却步。我可以使用 AWS Glue,但这对于仅抑制 SQL 查询中的 header 来说似乎有点矫枉过正。
最佳答案
这是一种绕过它的hacky方法
SELECT bucket as "my-bucket-name", key as "fakekey"
from your_athena_table
这将使您的标题看起来像文件的其余部分,不会破坏 S3 批量复制作业。您将只有一个失败的 fakekey 记录
关于amazon-web-services - 如何抑制 AWS Athena 查询结果中的列标题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56762050/