python - 如何使用 aggfunc 'min' 在dask中执行pivot_table?

标签 python pandas dask

我正在尝试在 pandas 或 dask 中创建数据透视表,但当然我在 pandas 中遇到内存错误。这就是我想使用 dask 的原因,因为我想可能处理更大的文件。

在 pandas 中我这样做了:

df =df.pivot_table(values="A", index="B", columns="C", aggfunc=np.min)

但是在Dask中无法使用np.min。还有其他一些聪明的方法可以用 Dask 来做到这一点吗?

最佳答案

看起来 Dask 数据帧引发了以下错误

ValueError("aggfunc must be either 'mean', 'sum' or 'count'")

也许您应该提交功能请求? https://github.com/dask/dask/issues/new

关于python - 如何使用 aggfunc 'min' 在dask中执行pivot_table?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57536782/

相关文章:

python - 如何将 Dask 数据帧作为 dask-ml 模型的输入传递?

python - 已知结构矩阵的 NumPy 矩阵乘法效率

python - 如何知道列表的元素数量是偶数还是奇数

python - 在for循环中使用python字典读取多个不同名称的CSV文件

python - 如何有效地从 Pandas 数据框中减去每一行?

python - 如何在连接时合并大型数据框并消除不相关的列?

python - Dask 在 read_csv 上加载和应用函数

Python:查找文本中的单词列表并返回其索引

python - skmultiLearn 分类器预测始终返回 0

python - 两个 DataFrame 的复杂合并