我希望用特定值替换 spark 数据框中列的所有值。我正在使用 pyspark。我试过类似的东西-
new_df = df.withColumn('column_name',10)
这里我想将 column_name
列中的所有值替换为 10
。在 Pandas 中,这可以通过
df['column_name']=10
。我无法弄清楚如何在 Spark 中执行相同的操作。
最佳答案
使用 lit
可能更容易,如下所示:
from pyspark.sql.functions import lit
new_df = df.withColumn('column_name', lit(10))
关于python - 用 pyspark 替换数据框中一列的所有值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36295739/