当前分类:apache-spark

apache-spark - PairRDD 上的 Join 会导致通过键共同定位数据吗?

streaming - 如何使 Spark 分区具有粘性,即与节点保持一致?

scala - Spark-Scala HBase 表创建失败(MetaException(消息 :file:/user/hive/warehouse/src is not a directory or unable to create one)

scala - Spark 导入 apache 库(数学)

apache-spark - 将日志与 Apache Spark 分开

java - 如何避免应用程序日志中的 Spark 和 Hive 日志

scala - 如何在 Spark/Scala 中对数据集的列求和?

hadoop - 是否可以使用 Spark 的 jdbc 驱动程序将 apache Spark 与 jasper 集成?

scala - 使用 Apache Spark 提取 kmeans 集群信息

apache-spark - Spark 是否适合分析(无需重新分发)来自多台计算机的日志?

apache-spark - Spark 作业完成后,OFF_HEAP rdd 被 Tachyon 自动删除

scala - Spark 流的迭代算法

apache-spark - 使用 datastax 连接器连接到 cassandra

apache-spark - Spark中leftOuterJoin的性能如何?

hive - 为什么 Spark SQL 使用来自 Hive 的 hive-site.xml 会失败并显示 "NumberFormatException: For input string: "1s""?

sql - Spark 1.3 中未找到命令策略类

scala - 在 Apache Spark 中使用联接时,数据集大小的组织是否重要?

jdbc - Spark作业服务器错误类未找到异常

scala - 相同类型的 Apache Spark 类型不匹配(字符串)

apache-spark - Spark 作业卡在方法收集上

热门标签: