我有一个有时包含空值的数据框,我想将其替换为一系列值(例如从 0 到 100 的随机整数)中的单个值,而不是始终相同的值。
na.fill()
函数似乎不允许这样做,而且我找不到手动执行此操作的好方法。
我使用 Python 和 Spark 2.2
最佳答案
逐一检查每个单元格,检查值是否为空,如果为空,则将其更改为随机数。
首先,导入随机。然后是这样的:
df = df.where(df.a.isNull()).replace(null, random.randrange(min, max+1))
关于python - 如何使用多个值更改 Spark 中 DataFrame 的 na 值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47784223/