有一些API可用于为RDD分配名称。
例如
val y = sc.parallelize(List(1,2,3))
y.setName("New Name")
有什么好处呢?是否有特定原因可以在Spark中使用此功能?
提前致谢。
最佳答案
缓存它时,您可以在“存储”选项卡上的Spark的Web UI中看到该名称。
关于scala - 将名称设置为RDD的优点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36061899/