我正在尝试在 pandas 或 dask 中创建数据透视表,但当然我在 pandas 中遇到内存错误。这就是我想使用 dask 的原因,因为我想可能处理更大的文件。
在 pandas 中我这样做了:
df =df.pivot_table(values="A", index="B", columns="C", aggfunc=np.min)
但是在Dask中无法使用np.min
。还有其他一些聪明的方法可以用 Dask 来做到这一点吗?
最佳答案
看起来 Dask 数据帧引发了以下错误
ValueError("aggfunc must be either 'mean', 'sum' or 'count'")
也许您应该提交功能请求? https://github.com/dask/dask/issues/new
关于python - 如何使用 aggfunc 'min' 在dask中执行pivot_table?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57536782/