python - dask中基于多个条件的行明智选择?

标签 python numpy dask

dask 中根据多个条件选择行的最高效方法是什么?在 pandas 中,类似

df[df.A > 0 & df.B <= 10]

确实有效。然而,在 dask 中,这将返回错误。到目前为止我想出的最好的解决方案是使用 numpys logic_and()function:

df[np.logical_and(df.A > 0, df.B <= 10)]

但是,这非常慢,因为它会触发多次计算(我认为)。有没有更高效的方法来根据多个条件在 dask 中选择行?

最佳答案

感谢@joris的提示,正确位置的括号有效。所以dask中的解决方案与pandas解决方案类似/相同:

df[(df.A > 0) & (df.B <= 10)]

关于python - dask中基于多个条件的行明智选择?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40627980/

相关文章:

c# - 在同一台机器上托管的 C# 和 Python 应用程序之间的通信

python - Matplotlib - 看不见的边距切断了 3D 绘图数据?

python - 原始 CR2 图像旋转并保存未压缩以访问像素 RGB

python - 将一个函数计算出的值传递给另一个函数

python - 使用值作为索引沿新维度折叠一个 numpy 数组

python - Numpy 数组 : NOT select specific rows or columns

python - 计算 dask 数据帧中所有行差异的有效方法

dask - dask 工作人员存储结果或文件的默认目录是什么?

python - 使用 daa 深度处理大堆栈

Python (numpy) - 关联两个分箱图