我有一个包含两列的数据框:
+--------+-----+
| col1| col2|
+--------+-----+
|22 | 12.2|
|1 | 2.1|
|5 | 52.1|
|2 | 62.9|
|77 | 33.3|
我想创建一个新的数据框,它只需要行
"value of col1" > "value of col2"
正如一个说明 col1 已长 类型和 col2 有双 类型
结果应该是这样的:
+--------+----+
| col1|col2|
+--------+----+
|22 |12.2|
|77 |33.3|
最佳答案
另一种可能的方法是使用 where
DF 的功能。
例如这个:
val output = df.where("col1>col2")
会给你预期的结果:
+----+----+
|col1|col2|
+----+----+
| 22|12.2|
| 77|33.3|
+----+----+
关于apache-spark - 根据pyspark中的条件从数据框中删除行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52395986/