我是scala的新手。我正在迭代RDD并将每个值存储在数组或任何其他集合中。但是值不存储在Array内部。
val ItrRdd = sqlContext.sql("select district,state FROM world ").rdd
var ItrRdd_data = ItrRdd.map { x =>
(x.getString(0), x.getString(1))
}
var district = Array[String]()
ItrRdd_data.map{ x =>
district.+:(x._1)
}
然后,如果我打印区,则它将为空白。
有人可以帮我做这个或其他类似的事情。
提前致谢。
最佳答案
使用下面的方法来计算district
val district = ItrRdd_data.map({ case(x,y) => x -> y }).collect()
关于arrays - 在数组或Scala Spark中的其他任何集合中迭代RDD和存储的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41995659/