python - 如何使用多个值更改 Spark 中 DataFrame 的 na 值

我有一个有时包含空值的数据框，我想将其替换为一系列值(例如从 0 到 100 的随机整数)中的单个值，而不是始终相同的值。

na.fill()函数似乎不允许这样做，而且我找不到手动执行此操作的好方法。
我使用 Python 和 Spark 2.2

最佳答案

逐一检查每个单元格，检查值是否为空，如果为空，则将其更改为随机数。

首先，导入随机。然后是这样的:

df = df.where(df.a.isNull()).replace(null, random.randrange(min, max+1))

关于python - 如何使用多个值更改 Spark 中 DataFrame 的 na 值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47784223/