我有一个包含很多列的数据框,其中包含很多整数值。我想为行中第二小的值返回列的名称。
我能够返回一行中最低值的列名,这非常简单:
import pandas as pd
matrix = [(22, 2, 13),
(9, 1, 5),
(5, 4, 3),
(6, 3, 1),
(1, 2, 20)]
dfObj = pd.DataFrame(matrix, index=list('abcde'), columns=list('xyz'))
minValueIndexObj = dfObj.idxmin(axis=1)
print("min values of row are at following columns :")
print(minValueIndexObj)
Out[]:
min values of row are at following columns :
a y
b y
c z
d z
e x
dtype: object
“a”行的“y”列的值最低。
接下来我需要的是:
2nd min values of row are at following columns :
a z
b z
c y
d y
e y
dtype: object
感谢您的支持。
最佳答案
使用argsort
对于按排序值排列的所有列名称的数组:
a = dfObj.columns.values[np.argsort(dfObj.values)]
print (a)
[['y' 'z' 'x']
['y' 'z' 'x']
['z' 'y' 'x']
['z' 'y' 'x']
['x' 'y' 'z']]
然后通过索引选择'columns'
并传递给Series
构造函数:
print (pd.Series(a[:, 0], index=dfObj.index))
a y
b y
c z
d z
e x
dtype: object
print (pd.Series(a[:, 1], index=dfObj.index))
a z
b z
c y
d y
e y
dtype: object
关于python - 如何选择行中的第二个最小值并返回它们各自的列名?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57607944/