python - 如何删除从pandas中的excel读取的重复列

Excel 中的数据:

a   b   a   d
1   2   3   4
2   3   4   5
3   4   5   6
4   5   6   7

代码:

df= pd.io.excel.read_excel(r"sample.xlsx",sheetname="Sheet1")
df
   a  b  a.1  d
0  1  2    3  4
1  2  3    4  5
2  3  4    5  6
3  4  5    6  7

如何删除列a.1？

当pandas从excel读取数据时，它会自动将第二个a的列名更改为a.1。

我尝试了 df.drop("a.1",index=1) ，这不起作用。

我有一个巨大的 Excel 文件，其中有重复的名称，而且我只对其中的几列感兴趣。

最佳答案

您需要为drop传递axis=1上类:

In [100]:
df.drop('a.1', axis=1)

Out[100]:
   a  b  d
0  1  2  4
1  2  3  5
2  3  4  6
3  4  5  7

或者只是传递感兴趣的列列表以进行列选择:

In [102]:
cols = ['a','b','d']
df[cols]

Out[102]:
   a  b  d
0  1  2  4
1  2  3  5
2  3  4  6
3  4  5  7

也适用于“花式索引”:

In [103]:
df.ix[:,cols]

Out[103]:
   a  b  d
0  1  2  4
1  2  3  5
2  3  4  6
3  4  5  7

关于python - 如何删除从pandas中的excel读取的重复列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30528840/