apache-spark - spark SQL-Tungsten Aggregate 和 Tungsten Exchange 是什么意思?

标签 apache-spark pyspark apache-spark-sql

我在 SparkSQL 数据帧上运行一个非常简单的 count(),这里是 Web UI 中的一些相应 DAG。

Web UI DAG

TungstenAggregateTungstenExchange 指的是什么? (谷歌搜索没有结果。)

代码:

ndata2 = sqlContext.createDataFrame(sc.textFile(filePath).map(lambda x : x.split(",")),["key","value"])
ndata2.count()

最佳答案

根据 this comment通过 zero323,

TungstenExchange is a shuffle.

不过,我还是很想知道 TungstenAggregate 是什么。

关于apache-spark - spark SQL-Tungsten Aggregate 和 Tungsten Exchange 是什么意思?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38795557/

相关文章:

scala - 处理极大数据时设备上没有剩余空间

pyspark - 为什么我不能在双表 SparkSQl 上执行并集?

python - 在多列上使用 df.withColumn()

python - 使用 pyspark 进行权重采样

scala - 为什么 Spark RDD 在 T 中是不变的?

python - 使用 Python 的 Apache Spark TFIDF

python - 如何在 Zeppelin 中的 %pyspark 解释器和 %python 解释器之间传递数据集?

apache-spark - PySpark SparkSession Builder 与 Kubernetes Master

apache-spark - java.lang.ClassNotFoundException : org. apache.hadoop.util.StopWatch

python - Apache Spark Streaming 不读取目录