amazon-web-services - S3 选择定价如何运作? s3 select中返回和扫描的数据是什么意思

标签 amazon-web-services amazon-s3 amazon-athena presto amazon-s3-select

我有 100 万行 CSV 数据。选择 10 行,我是否需要支付 10 行的费用。 S3 Select中返回的数据和扫描的数据是什么意思?

关于 S3 select 的这些条款的文档较少

最佳答案

为了简单起见,让我们暂时忘记 S3 以柱状方式读取。假设您有以下数据:

| City       | Last Updated Date   |
|------------|---------------------|
| London     | 1st Jan             |
| London     | 2nd Jan             |
| New Delhi  | 2nd Jan             |

获取最新更新日期的查询
  • 强制 S3 扫描所有 3 条记录
  • 但是返回的记录只有2条(最后更新日期是1月2日)

  • 查询上次更新日期为 1 月 1 日的选择城市,
  • 将扫描所有 3 行
  • 但只返回 1 个字符串 - “新德里”。

  • 因此,根据您的查询,它可能会扫描更多数据(3 行)但返回较少数据(2 行)。

    我希望您现在了解扫描数据和返回数据之间的区别。

    关于amazon-web-services - S3 选择定价如何运作? s3 select中返回和扫描的数据是什么意思,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53001443/

    相关文章:

    amazon-web-services - 使用 tar.gz 文件作为 Amazon Athena 的源

    csv - 当我们从 s3 中的 csv 文件读取数据并在 aws athena 中创建表时如何跳过标题。

    amazon-web-services - 解析在 AWS Athena/AWS Glue 目录中的一列中包含换行符的 csv 文件

    amazon-web-services - 防止 Auto Scaling 组向 CloudFormation 报告成功,直到 EC2 和 ELB 运行状况检查至少通过一次

    ruby-on-rails - 如何更改 Rails asset_tag URL 的格式?

    amazon-web-services - AWS 服务设计和微服务

    scala - 按日期周期从 Spark 中的 S3 读取多个文件

    database - 发电机 : How to store a list of items

    python - 使用 Python 将 json 文件从 S3 读取到 sagemaker 笔记本中

    amazon-web-services - 为什么预签名帖子需要 s3 :PutObjectAcl permission?