如何使用 Spark scala 遍历以下 RDD。我想打印 Seq 中存在的每个值以及关联的键
res1: org.apache.spark.rdd.RDD[(java.lang.String, Seq[java.lang.String])] = MapPartitionsRDD[6] at groupByKey at <console>:14
我尝试了以下代码。
val ss=mapfile.map(x=>{
val key=x._1
val value=x._2.sorted
var i=0
while (i < value.length) {
(key,value(i))
i += 1
}
}
)
ss.top(20).foreach(println)
最佳答案
我尝试按如下方式转换您的代码:
val ss = mapfile.flatMap {
case (key, value) => value.sorted.map((key, _))
}
ss.top(20).foreach(println)
这是你想要的吗?
关于scala - Spark scala RDD遍历,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25621902/