python - Pandas 数据框多行查询

标签 python python-3.x pandas python-3.6 multiline

说我有一个数据框

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.randint(10, size=(10,3)), columns=['a', 'b', 'c'])

如果我现在尝试使用query方法查询它:
这有效:df.query('''a > 3 and b < 9''')这会引发错误:

df.query(
    '''
        a > 3 and
        b < 9
    '''
)

我尝试了多行字符串的许多变体，但结果始终是以下错误:

~/ven/lib/python3.6/site-packages/pandas/core/computation/eval.py in eval(expr, parser, engine, truediv, local_dict, global_dict, resolvers, level, target, inplace)
    306     if multi_line and target is None:
    307         raise ValueError(
--> 308             "multi-line expressions are only valid in the "
    309             "context of data, use DataFrame.eval"
    310         )

ValueError: multi-line expressions are only valid in the context of data, use DataFrame.eval

有谁知道如何使它工作？
问题是，实际上我要执行很长的查询，而必须全部写在一行中会非常不便。
我知道我可以改用 bool 索引，但是我的问题只是关于如何在query方法中使用多行。
谢谢

最佳答案

使用多行字符反斜杠(\)
例如:

df = pd.DataFrame(np.random.randint(10, size=(10,3)), columns=['a', 'b', 'c'])
print(df.query(
    '''
        a > 3 and \
        b < 9
    '''
))

关于python - Pandas 数据框多行查询，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63597476/

上一篇：android - Jetpack Compose 可以用来构建 App Widgets 吗？

下一篇：matlab - 弃用后哪个函数代替了R2016a的svmtrain？

相关文章：

python - 为什么每个级别都需要 __init__.py？

python - 计算列值的出现次数，然后将计数输入到列中，对于匹配聚合列值 : 的每一行

python - pandas DataFrame 中的操作

python - SciPy/pytest : Skip specific test

python-3.x - 在 Pandas 中按组均值创建以总均值为中心的变量

python - Django 管理员 : Add <select multiple> to the *other* model in a many-to-many relationship

python - 如何使用 pandas 将字典转换为仅包含列子集的数据框？

python - 混合多处理和串行端口

python-3.x - Colab 中的 RAPIDS 属性错误 : module 'cudf' has no attribute '_lib'

python - 从 X-Y 元组列表的字典中获取最大 X 和 Y 的最有效方法