python - 如何加快 Numpy 中的行选择？

我有一个相当大的数据集 raw，我最初选择这样的行:

raw = np.array(Some Matrix)
selected = [r for r in raw if r[1] == '20130525' and r[2] < 120000]

但这真的很慢，有人知道如何使用 Numpy 的内置函数加快速度吗？

最佳答案

这将是标准的 numpythonic 方法:

selected = raw[(raw[:, 1] == '20130525') & (raw[:, 2] == 120000)]

但是如果你有一个 object 类型的数组，加速可能会很微弱，正如混合数据类型所暗示的那样。你到底在处理什么？可以改用 recarray 吗？

关于python - 如何加快 Numpy 中的行选择？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18050765/

相关文章：

python - 在 CLI 中打印 DataFrame 时如何应用边框？