amazon-s3 - 如何使用 Parquet 文件源重命名 AWS Athena 列?

标签 amazon-s3 parquet amazon-athena

我将数据作为多个 parquet 文件加载到我的 S3 存储桶文件夹中。 将它们加载到 Athena 后,我可以成功查询数据。

有什么方法可以重命名parquet文件源的Athena表列,查询后仍能看到重命名列下的数据?

注意:使用编辑架构选项进行检查,列正在重命名,但查询后您将看不到该列下的数据。

最佳答案

据我所知,没有办法创建一个表,其列名与文件中的名称不同。该表可以有更少或更多的列,但只有与文件中的名称相同的名称才是可查询的。

但是,您可以创建具有其他名称的 View ,例如:

CREATE OR REPLACE VIEW a_view AS
SELECT
  a AS b,
  b AS c
FROM the_table

关于amazon-s3 - 如何使用 Parquet 文件源重命名 AWS Athena 列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54558973/

相关文章:

python - 开始使用 Python 进行安全的 AWS CloudFront 流传输

amazon-s3 - 如何在AWS s3中同时拥有公共(public)访问和私有(private)访问?

php - 使用 amazon s3 的 fineuploader 时收到无效的策略文档或请求 header 错误

apache-spark - 如何使用 SPARK 将多个 parquet 文件转换为 TFrecord 文件?

amazon-s3 - 带有 Snappy 压缩的 Parquet 格式的 Redshift COPY 命令

amazon-web-services - AWS Athena 导入 CSV 文件

java - 从 Athena 查询执行 ID 获取输出位置

java - spring-integration-aws java配置

pyspark - 为什么在胶水 pyspark ETL 作业中无法添加到 Parquet 表中的新列?

amazon-s3 - 如何按计划运行 Athena 查询并将结果集发送到电子邮件