amazon-web-services - AWS Glue 执行程序内存限制

标签 amazon-web-services apache-spark aws-glue

我发现 AWS Glue 将执行程序的实例设置为内存限制为 5 Gb --conf spark.executor.memory=5g有时,在大型数据集上它会失败,java.lang.OutOfMemoryError .驱动程序实例 --spark.driver.memory=5g 也是如此。 .
有没有办法增加这个值?

最佳答案

尽管 aws 文档指出 --conf参数不应传递,我们的 AWS 支持团队告诉我们传递 --conf spark.driver.memory=10g这纠正了我们遇到的问题

关于amazon-web-services - AWS Glue 执行程序内存限制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49034126/

相关文章:

amazon-web-services - 无法使用 create_dynamic_frame.from_catalog 从 AWS 胶水作业访问使用分区投影配置的表中的数据

amazon-web-services - 在 lambda 函数中使用 EventBridge 事件模式字符串

amazon-web-services - 无法创建胶水连接

amazon-web-services - 如何终止到 elb 的 HTTPS 流量并且容器正在运行 HTTP (fargate)

java - aws api 网关速度中的转义字符

python - 在不使用数据帧的情况下匹配键并在 pyspark 中加入 2 个 RDD

apache-spark - 如何从pyspark中的时间戳中提取时间?

sql-server - 无法删除 Amazon RDS SQL Server 数据库

amazon-web-services - 如何使用 Cognito LOGOUT 端点真正注销?

apache-spark - 如何处理 Spark ALS 从 MLlib 生成的模型中的新用户/项目?