amazon-web-services - 如何抑制 AWS Athena 查询结果中的列标题?

标签 amazon-web-services amazon-athena

我正在 S3 存储桶 list 上运行 SELECT Athena 查询。然后,我想在 S3 批处理操作中以 .csv 格式使用该查询的结果。

我的查询运行良好,我能够通过 S3 Batch 访问 .csv 输出,但由于第一行实际上是列标题,S3 Batch 会抛出不可恢复的错误,因为它认为 list 现在指的是多个存储桶。

如何轻松地从结果中去除列标题?我宁愿只用 SQL 来做。文件大小使得使用标准 unix 工具望而却步。我可以使用 AWS Glue,但这对于仅抑制 SQL 查询中的 header 来说似乎有点矫枉过正。

最佳答案

这是一种绕过它的hacky方法

SELECT bucket as "my-bucket-name", key as "fakekey"
from your_athena_table

这将使您的标题看起来像文件的其余部分,不会破坏 S3 批量复制作业。您将只有一个失败的 fakekey 记录

关于amazon-web-services - 如何抑制 AWS Athena 查询结果中的列标题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56762050/

相关文章:

django - 如何将 Multi-Tenancy django 应用程序部署到 AWS?

amazon-web-services - 设置 AWS ApiGateway 端点所需的 API key (Swagger 导入)

amazon-athena - Amazon Athena 允许查看访问并拒绝表访问

python-3.x - 如何在 python lambda 中对 aws athena sql 查询进行单元测试?

sql - 分区 Athena 表中的子查询

amazon-web-services - 是否可以使用 AWS CLI 等待实例为 'online' 并完成 opsworks 的设置/配置步骤?

ruby - Capistrano 部署 SSHKit::Runner::ExecuteError:rake 退出状态:1

python - 使用 Boto 3 显示 EC2 实例名称

hive - Amazon Athena 时间日期作为字符串列

amazon-web-services - 在 Glue 表 (RDS) 上运行 AWS Athena 查询时出现 HIVE_UNKNOWN_ERROR