python - PySpark 数据框 : comma to dot

我在 float 中使用逗号导入了数据，我想知道如何将逗号“转换”为点。我正在使用 pyspark 数据框，所以我尝试了这个:

commaToDot = udf(lambda x : str(x).replace(',', '.'), FloatType())

myData.withColumn('area',commaToDot(myData.area))

而且绝对行不通。那么我们可以直接在 spark 的数据框中替换它，还是应该切换为 numpy 类型或其他类型？

谢谢!

最佳答案

另一种方法(不使用 UDF)是:

myData = myData.withColumn('area', regexp_replace('area', ',', '.').cast('float'))

关于python - PySpark 数据框 : comma to dot，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44022377/

相关文章：

python - 将 float 舍入为 x 位小数？