我有一个包含多列的数据框。
>>> df.take(1)
[Row(A=u'{dt:dt=string, content=Prod}', B=u'{dt:dt=string, content=Staging}')]
我想从 df 的 A 列和 B 列的值中删除花括号“{”和“}”。我知道我们可以使用:
df.withColumn('A',regexp_replace('A','//{',''))
df.withColumn('A',regexp_replace('A','//}',''))
df.withColumn('B',regexp_replace('B','//}',''))
如何为 Spark 数据帧的所有列动态替换字符? ( Pandas 版如下图)
df = df.replace({'{':'','}':''},regex=True)
最佳答案
只需使用正确的正则表达式:
df.withColumn("A", regexp_replace("A", "[{}]", ""))
关于python - 如何替换 spark 数据框所有列中的多个字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47361665/