我在 float 中使用逗号导入了数据,我想知道如何将逗号“转换”为点。我正在使用 pyspark 数据框,所以我尝试了这个:
commaToDot = udf(lambda x : str(x).replace(',', '.'), FloatType())
myData.withColumn('area',commaToDot(myData.area))
而且绝对行不通。 那么我们可以直接在 spark 的数据框中替换它,还是应该切换为 numpy 类型或其他类型?
谢谢!
最佳答案
另一种方法(不使用 UDF)是:
myData = myData.withColumn('area', regexp_replace('area', ',', '.').cast('float'))
关于python - PySpark 数据框 : comma to dot,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44022377/