amazon-web-services - AWS Athena - 使用 SQL 更新表行

标签 amazon-web-services amazon-athena parquet-dataset

我是 AWS 生态系统的新手。我正在创建一个使用 AWS Athena 查询数据的应用程序。使用 AWS Glue 将数据从 JSON 转换为 parquet,并存储在 S3 中。

现在的用例是使用 SQL 更新 Parquet 数据。

我们可以使用 AWS Athena SQL 命令更新底层 Parquet 数据吗?

最佳答案

不,不可能在 Amazon Athena 中使用 UPDATE

Amazon Athena 是一个查询引擎,而不是数据库。它对存储在 Amazon S3 中的数据执行查询。它读取那些文件,但修改或更新这些文件。因此,它无法“更新”表格。

最接近的功能是使用CREATE TABLE AS 创建一个 表。您可以提供一个使用其他表中数据的 SELECT 查询,这样您就可以有效地修改信息并将其存储在新表中,并告诉它对该新表使用 Parquet。事实上,这是将数据从其他格式转换为 Snappy 压缩的 Parquet 文件(如果需要,可以进行分区)的绝佳方式。

关于amazon-web-services - AWS Athena - 使用 SQL 更新表行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71705848/

相关文章:

amazon-web-services - 如何使用boto3快速提取S3中的文件?

php - REST API 认证 : how to prevent man-in-the-middle replays?

amazon-s3 - 使用正则表达式将日志从 S3 导入到 Athena

amazon-web-services - AWS Athena 从 S3 的 GLUE Crawler 输入 csv 创建的表中返回零记录

amazon-web-services - AWS Athena 上的 AccessDenied

amazon-web-services - AWS Athena 对于 api 来说太慢了?

amazon-web-services - 模板格式错误: Every Mappings attribute must be a String or a List