我有一个数据集[String],需要转换成一个RDD[String]。怎么办?
注意:我最近从 spark 1.6 迁移到了 spark 2.0。我的一些客户期望使用 RDD,但现在 Spark 给了我数据集。
最佳答案
如 scala API documentation 中所述您可以在数据集上调用 .rdd
:
val myRdd : RDD[String] = ds.rdd
关于java - Spark 将数据集转换为 RDD,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38796520/