arrays - 在数组或Scala Spark中的其他任何集合中迭代RDD和存储的值

标签 arrays scala hadoop apache-spark rdd

我是scala的新手。我正在迭代RDD并将每个值存储在数组或任何其他集合中。但是值不存储在Array内部。

val ItrRdd = sqlContext.sql("select district,state FROM world ").rdd
var ItrRdd_data = ItrRdd.map { x =>
       (x.getString(0), x.getString(1))
    }

var district = Array[String]()

ItrRdd_data.map{ x => 
      district.+:(x._1)
    }   

然后,如果我打印,则它将为空白。
有人可以帮我做这个或其他类似的事情。

提前致谢。

最佳答案

使用下面的方法来计算district

val district = ItrRdd_data.map({ case(x,y) => x -> y }).collect()

关于arrays - 在数组或Scala Spark中的其他任何集合中迭代RDD和存储的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41995659/

相关文章:

javascript - 如何访问 map 内的下一个/上一个对象 - react ?

java - arraylist 排序并转换为 String[]

arrays - 将嵌套结构中的数组追加到另一个嵌套结构中的另一个数组

scala - Spark 数据帧 : Pivot and Group based on columns

hadoop - Kafka 0.10.2.0中的__consumer_offsets主题问题

javascript - 数组最大长度不起作用

scala - 如何在 Akka Http 中以编程方式调用 Route

java - 流式传输 json 元素

hadoop - SQL 中的动态聚合 (Hive)

json - 使用 Play 2.3 和 Scala 2.11.1 将具有枚举属性的类转换为 Json 时出错