java - Spark 蓄能器复位

标签 java apache-spark accumulator

有没有一种方法可以通过驱动程序重置 spark Accumulator,以便 executors Accumulator 也将被清理。

我有一个实际上是列表的累加器> 所有执行者将元组添加到累加器中,驱动程序读取它。 问题是执行程序堆被填满了。

当驱动程序读取所有数据时,执行程序不需要本地数据。

谢谢

最佳答案

我想知道您是否尝试过使用 Accumulators 的公共(public)方法 setValue() 由驱动程序重置 Accumulator。

You might be able to use this, i.e. setValue() method, to reset accumulators’ values to smaller objects (e.g. the “zero” object of whatever your accumulator type is, or ‘null’ if you’re sure that the accumulator will never be accessed again).

来自 https://issues.apache.org/jira/browse/SPARK-3885

关于java - Spark 蓄能器复位,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39080859/

相关文章:

java - Jtree根据鼠标点击获取对象?

java - 在 IBM MQ (Java) 中,如何访问给定队列管理器下的所有队列(最好使用 PCF)?

c++ - 如何使用 OpenCL 内核制作累加器?

scala - 错误:找不到:值StructType/StructField/StringType

accumulator - HQ9+ 中的 'accumulator' 是什么?

garbage-collection - 如何确保未使用的累加器的垃圾收集?

java - 计算输入数的最大值和平均值

java - 如何逻辑地创建一个Graph?

java - Kibana 的 Timelion : Field [timestamp_ms] of type [text] does not support custom time zones

java服务-spark通信