我知道以下所述在scala中存在一种方法。
val joined_df = df1.join(broadcast(df2), "key")
如何在Java中进行广播联接。
我必须做sc.broadcast(df2)并在联接中使用它吗?那会被称为广播加入吗?
最佳答案
How can I do the Broadcast join in Java.
完全一样。
import static org.apache.spark.sql.functions.broadcast;
Datset<Row> joined = df1.join(broadcast(df2), "key");
关于apache-spark - 有没有办法在Java Spark 2.1中进行广播联接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53795767/