当前分类:rdd

python - 如何使用 Spark 和 Caffe 对图像进行分类

python - RDD.take 不起作用

scala - kafka directstream dstream map 不打印

apache-spark - 无法推断类型 : <type 'unicode' > when converted RDD to DataFrame 的架构

java - Apache Spark Accumulable addInPlace 需要返回 R1?或者有什么值(value)?

apache-spark - Spark DataFrame 缓存大型临时表

scala - 将 HadoopRDD 转换为 DataFrame

apache-spark - 优化 Spark mergeByKey

scala - Spark(流)RDD foreachPartitionAsync 功能/工作

apache-spark - 启用检查点的 Spark Streaming 中的 java.io.NotSerializedException

scala - Spark 斯卡拉: Split each line between multiple RDDs

python - Spark : How to "reduceByKey" when the keys are numpy arrays which are not hashable?

python - 如何使用PySpark将一个RDD拆分为两个RDD并将结果保存为RDD?

scala - 使用 Scala 将 SparkRDD 写入 HBase 表

scala - Spark 斯卡拉: Pass a sub type to a function accepting the parent type

rdd - SPARK 内存计算

scala - 尽管使用了 import sqlContext.implicits._,但 toDF 无法编译

apache-spark - 在 RDD 转换时保留 Spark DataFrame 列分区

scala - 错误 : org. apache.spark.rdd.RDD[(String,Int)] 不带参数

hadoop - java.io.NotSerializedException : org. apache.spark.InterruptibleIterator 在spark java中执行mapPartition()时

热门标签: