amazon-web-services - HIVE_CURSOR_ERROR : Please reduce your request rate

标签 amazon-web-services amazon-s3 amazon-athena

我正在使用 CloudTrail 日志对我的 s3 存储桶运行简单查询。桶很大,大约 1 分 45 秒后出现错误

HIVE_CURSOR_ERROR: Please reduce your request rate.



有没有办法在 Athena 中限制对我的 s3 存储桶的请求率?

SELECT *
FROM default.cloudtrail_logs_cloudtraillog
WHERE eventname = 'DeleteUser' AND awsregion = 'us-east-1'

最佳答案

所以我将总结 AWS 提出的解决方案。它们都不是很好,我想知道为什么 AWS 不会在它们的末端进行节流,而是抛出错误。

默认情况下,S3 将自动扩展以支持非常高的请求率。当您的请求率扩展时,S3 会根据需要自动对您的 S3 存储桶进行分区以支持更高的请求率。但是,有时它仍然会出错。所以他们建议等待(不建议时间范围)给 S3 足够的时间来根据它收到的请求率自动分区您的存储桶。

他们还建议:

1) 使用 S3distcp 实用程序将小文件组合成更大的对象。 https://docs.aws.amazon.com/emr/latest/ReleaseGuide/UsingEMR_s3distcp.html

2) 分区https://docs.aws.amazon.com/athena/latest/ug/partitions.html

关于amazon-web-services - HIVE_CURSOR_ERROR : Please reduce your request rate,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59686651/

相关文章:

amazon-web-services - terraform aws_lb_listener_rule 条件参数在 terraform 0.12.20 中未被识别

java - 与 zip aws S3 对象相关的类和接口(interface)有哪些?

amazon-web-services - 来自 S3 的亚马逊 emr spark 提交不起作用

amazon-web-services - AWS Athena 查询能否定期运行(即按计划运行)?

database - AWS Glue 缺少权限

datasource - 具有 Athena 自定义查询的 Tableau 数据源

logging - 在 AWS CloudTrail 中获取用户登录和注销信息

node.js - 如何使用无服务器框架引用不在根文件夹中的函数?

laravel - 如何在 AWS Elastic Beanstalk 上设置和使用 Laravel 调度?

java - Amazon S3 java sdk - 下载进度