在 PySpark 应用程序中,我尝试通过将数据帧转换为 pandas 来转置它,然后我想将结果写入 csv 文件。我是这样做的:
df = df.toPandas().set_index("s").transpose()
df.coalesce(1).write.option("header", True).option("delimiter", ",").csv('dataframe')
执行此脚本时出现以下错误:
'DataFrame' object has no attribute 'coalesce'
问题是什么?我该如何解决?
最佳答案
问题是您将 spark 数据帧转换为 pandas 数据帧。 Pandas 数据框没有 coalesce
方法。您可以查看 pandas 的文档 here .
当您使用 toPandas()
时,数据帧已经收集并在内存中,
尝试改用 pandas 数据框方法 df.to_csv(path)
。
关于python - 如何修复 'DataFrame' 对象没有属性 'coalesce'?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46464483/