java - Spark GC 时间非常长导致任务执行缓慢

标签 java apache-spark garbage-collection

我在 5 节点集群上运行 spark 应用程序。每个节点都配置为 16 核和 64 GB ram。

我的申请有 4 个阶段。第 4 阶段的 3 个阶段快速执行,即 mapToPair 是否需要太多时间(将近 4 小时)。

以下是职位 Executors GC Time 的职位统计信息

我也检查了执行程序日志,没有看到任何错误/异常。如果需要进行任何配置更改以提高性能,您能否建议我?

最佳答案

关于java - Spark GC 时间非常长导致任务执行缓慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47378165/

相关文章:

java - 在java异常中使用Solrj

Java:如何从用户指定的文件进行扫描

java - AWS S3 Java SDK 不将文件复制到文件夹

java - 如何使用 Java 检查从 Spark 结构化流中的 Kafka 获取数据?

java - 使用 spark JAVA API takeOrdered 方法出错

memory-management - 对 Julia 中的内存分配和垃圾收集感到困惑

java - BigInteger 循环无限执行

json - 将 JSON 对象数组转换为 pyspark 中的字符串

garbage-collection - 垃圾收集/链表

WPF不释放内存