这个问题在这里已经有了答案:
Select columns using pandas dataframe.query()
(5 个回答)
3年前关闭。
我正在尝试在 MultiIndex 列上使用查询。它适用于 MultiIndex 行,但不适用于列。是否有一个原因?该文档显示了与下面第一个类似的示例,但并不表示它不适用于 MultiIndex 列。
我知道还有其他方法可以做到这一点,但我特别想用查询函数 来做到这一点。
import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.random((4,4)))
df.index = pd.MultiIndex.from_product([[1,2],['A','B']])
df.index.names = ['RowInd1', 'RowInd2']
# This works
print(df.query('RowInd2 in ["A"]'))
df = pd.DataFrame(np.random.random((4,4)))
df.columns = pd.MultiIndex.from_product([[1,2],['A','B']])
df.columns.names = ['ColInd1', 'ColInd2']
# query on index works, but not on the multiindexed column
print(df.query('index < 2'))
print(df.query('ColInd2 in ["A"]'))
最佳答案
要回答我自己的问题,根据此处的答案,似乎根本不应该使用查询(无论是否使用 MultiIndex 列)来选择某些列:
Select columns using pandas dataframe.query()
关于Python/Pandas - 查询多索引列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51502959/