我有一个包含许多列的 Pandas 数据框。
我想更改列的顺序,以便只有其中的一个子集首先出现。我不关心其余部分的顺序(变量太多无法一一列出)
例如,如果我的数据框是这样的
a b c d e f g h i
5 8 7 2 1 4 1 2 3
1 4 2 2 3 4 1 5 3
我想指定列的子集
mysubset=['d','f']
并重新排序数据框,这样
列的顺序现在是
d,f,a,b,c,e,g,h,i
有没有办法以 Pandas 式的方式做到这一点?
最佳答案
您可以使用列掩码:
>>> mysubset = ["d","f"]
>>> mask = df.columns.isin(mysubset)
>>> pd.concat([df.loc[:,mask], df.loc[:,~mask]], axis=1)
d f a b c e g h i
0 2 4 5 8 7 1 1 2 3
1 2 4 1 4 2 3 1 5 3
或使用sorted
:
>>> mysubset = ["d","f"]
>>> df[sorted(df, key=lambda x: x not in mysubset)]
d f a b c e g h i
0 2 4 5 8 7 1 1 2 3
1 2 4 1 4 2 3 1 5 3
之所以有效,是因为 x not in mysubset
对于 d
和 f
将为 False,并且为 False < True。
关于python - 当列太多时如何更改 pandas 数据框中的列顺序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35994450/