python - Pandas 数据框多行查询

标签 python python-3.x pandas python-3.6 multiline

说我有一个数据框

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.randint(10, size=(10,3)), columns=['a', 'b', 'c'])
如果我现在尝试使用query方法查询它:
这有效:df.query('''a > 3 and b < 9''')这会引发错误:
df.query(
    '''
        a > 3 and
        b < 9
    '''
)
我尝试了多行字符串的许多变体,但结果始终是以下错误:
~/ven/lib/python3.6/site-packages/pandas/core/computation/eval.py in eval(expr, parser, engine, truediv, local_dict, global_dict, resolvers, level, target, inplace)
    306     if multi_line and target is None:
    307         raise ValueError(
--> 308             "multi-line expressions are only valid in the "
    309             "context of data, use DataFrame.eval"
    310         )

ValueError: multi-line expressions are only valid in the context of data, use DataFrame.eval
有谁知道如何使它工作?
问题是,实际上我要执行很长的查询,而必须全部写在一行中会非常不便。
我知道我可以改用 bool 索引,但是我的问题只是关于如何在query方法中使用多行。
谢谢

最佳答案

使用多行字符反斜杠(\)
例如:

df = pd.DataFrame(np.random.randint(10, size=(10,3)), columns=['a', 'b', 'c'])
print(df.query(
    '''
        a > 3 and \
        b < 9
    '''
))

关于python - Pandas 数据框多行查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63597476/

相关文章:

python - 为什么每个级别都需要 __init__.py?

python - 计算列值的出现次数,然后将计数输入到列中,对于匹配聚合列值 : 的每一行

python - pandas DataFrame 中的操作

python - SciPy/pytest : Skip specific test

python-3.x - 在 Pandas 中按组均值创建以总均值为中心的变量

python - Django 管理员 : Add <select multiple> to the *other* model in a many-to-many relationship

python - 如何使用 pandas 将字典转换为仅包含列子集的数据框?

python - 混合多处理和串行端口

python-3.x - Colab 中的 RAPIDS 属性错误 : module 'cudf' has no attribute '_lib'

python - 从 X-Y 元组列表的字典中获取最大 X 和 Y 的最有效方法