python - 如何在 ipython 中将 Spark RDD 转换为 pandas 数据帧?

标签 python pandas ipython pyspark rdd

我有一个 RDD,我想把它转换成 pandas dataframe。我知道要将 RDD 转换为普通的 dataframe 我们可以这样做

df = rdd1.toDF()

但我想将 RDD 转换为 pandas dataframe 而不是普通的 dataframe。我该怎么做?

最佳答案

您可以使用函数toPandas() :

Returns the contents of this DataFrame as Pandas pandas.DataFrame.

This is only available if Pandas is installed and available.

>>> df.toPandas()  
   age   name
0    2  Alice
1    5    Bob

关于python - 如何在 ipython 中将 Spark RDD 转换为 pandas 数据帧?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34817549/

相关文章:

python - 如何按同时包含数字和字符串的列对 Pandas 数据框进行排序?

python - 将值传播到 pandas 数据框中的列(透视)传感器事件

embed - 如何嵌入 ipython 0.12 以便它继承调用者的命名空间?

python - 设置 Emacs 以使用 python/IPython

python - 如何在python中安装fontTools

Python分割字符串索引超出范围

python - 使用pytube下载管视频时如何添加tqdm以显示进度栏?

python - 使用 pandas.to_csv() 时的时间格式

python - Pandas :我可以过滤数据框以仅获取彼此之间相差 50% 的行吗?

python-3.x - 类型错误 : __init__() got an unexpected keyword argument 'categorical_features'