arrays - 在数组或Scala Spark中的其他任何集合中迭代RDD和存储的值

我是scala的新手。我正在迭代RDD并将每个值存储在数组或任何其他集合中。但是值不存储在Array内部。

val ItrRdd = sqlContext.sql("select district,state FROM world ").rdd
var ItrRdd_data = ItrRdd.map { x =>
       (x.getString(0), x.getString(1))
    }

var district = Array[String]()

ItrRdd_data.map{ x => 
      district.+:(x._1)
    }

然后，如果我打印区，则它将为空白。
有人可以帮我做这个或其他类似的事情。

提前致谢。

最佳答案

使用下面的方法来计算district

val district = ItrRdd_data.map({ case(x,y) => x -> y }).collect()

关于arrays - 在数组或Scala Spark中的其他任何集合中迭代RDD和存储的值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41995659/

上一篇：hadoop - 在以下情况下如何将数据插入表中？

下一篇：hadoop - 如果一个系统的输入依赖于另一个系统的输出，那么在hadoop中会发生什么？

java - arraylist 排序并转换为 String[]

arrays - 将嵌套结构中的数组追加到另一个嵌套结构中的另一个数组

scala - Spark 数据帧 : Pivot and Group based on columns

hadoop - Kafka 0.10.2.0中的__consumer_offsets主题问题

javascript - 数组最大长度不起作用

scala - 如何在 Akka Http 中以编程方式调用 Route

java - 流式传输 json 元素

hadoop - SQL 中的动态聚合 (Hive)

json - 使用 Play 2.3 和 Scala 2.11.1 将具有枚举属性的类转换为 Json 时出错