Java中有一段代码:
Dataset<Row> dataset = ...
...
dataset.groupBy("id").count().filter("count > 1");
有没有办法设置"count > 1"
使用一些数据框方法的条件,例如 filter(count().gt(1))
?
最佳答案
函数“col”有比较方法,可以使用它们:
import static org.apache.spark.sql.functions.*;
ds.filter(col("count").$greater(lit(1)))
关于java - Spark : rewrite . 过滤器 ("count > 1") 没有字符串表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56182160/