python - 当列太多时如何更改 pandas 数据框中的列顺序?

标签 python pandas dataframe

我有一个包含许多列的 Pandas 数据框。

我想更改列的顺序,以便只有其中的一个子集首先出现。我不关心其余部分的顺序(变量太多无法一一列出)

例如,如果我的数据框是这样的

a b c d e f g h i
5 8 7 2 1 4 1 2 3
1 4 2 2 3 4 1 5 3

我想指定列的子集

mysubset=['d','f'] 并重新排序数据框,这样 列的顺序现在是

d,f,a,b,c,e,g,h,i

有没有办法以 Pandas 式的方式做到这一点?

最佳答案

您可以使用列掩码:

>>> mysubset = ["d","f"]
>>> mask = df.columns.isin(mysubset)
>>> pd.concat([df.loc[:,mask], df.loc[:,~mask]], axis=1)
   d  f  a  b  c  e  g  h  i
0  2  4  5  8  7  1  1  2  3
1  2  4  1  4  2  3  1  5  3

或使用sorted:

>>> mysubset = ["d","f"]
>>> df[sorted(df, key=lambda x: x not in mysubset)]
   d  f  a  b  c  e  g  h  i
0  2  4  5  8  7  1  1  2  3
1  2  4  1  4  2  3  1  5  3

之所以有效,是因为 x not in mysubset 对于 df 将为 False,并且为 False < True。

关于python - 当列太多时如何更改 pandas 数据框中的列顺序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35994450/

相关文章:

Python:根据数字序列分割DataFrame

python - 是否可以本地编译 Python(超越 pyc 字节码)?

python - Django 模板中的后向关系

python - 无法排除 Python 中的 cryptography.fernet.InvalidToken 错误

python - 具有来自 DataFrame 行的色调的 Seaborn 分类图

python - 如何根据条件替换字符串中的单词?

python - 如何根据值而非列绘制 2 条线

python - Pandas MultiIndex DataFrame.rolling offset

python - 是否有一个函数可以比较两个 DataFrame 并输出不同的元素?

java - 在 Python 中测试时加载不同的资源