dask 中根据多个条件选择行的最高效方法是什么?在 pandas 中,类似
df[df.A > 0 & df.B <= 10]
确实有效。然而,在 dask 中,这将返回错误。到目前为止我想出的最好的解决方案是使用 numpys logic_and()
function:
df[np.logical_and(df.A > 0, df.B <= 10)]
但是,这非常慢,因为它会触发多次计算(我认为)。有没有更高效的方法来根据多个条件在 dask 中选择行?
最佳答案
感谢@joris的提示,正确位置的括号有效。所以dask中的解决方案与pandas解决方案类似/相同:
df[(df.A > 0) & (df.B <= 10)]
关于python - dask中基于多个条件的行明智选择?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40627980/