在我的数据框中,有很多列,我只需要其中的几列。例如
Col_A Col_B Col_C Col_D Col_E Col_F
... ... ... ... ... ... ...
我只需要列Col_A、Col_C和Col_E
,所以目前我所做的是df = df[['Col_A', 'Col_C', 'Col_E']]
但这里的问题是,并不总是存在 A、C 和 E 列,也许所有这些都不会出现。所以我需要将 Col_A
位于 df.columns
中添加到 df 等。有什么简单的方法可以做到这一点吗?而不是那么多if
?现在,如果缺少一列,我会收到 KeyError: "['Col_C'] not in index
最佳答案
df[df.columns.intersection(['Col_A','Col_A','Col_E'], sort=False)]
关于python - 如何处理数据框中可变的列数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62079422/