我对 Python 中的排名很好奇。如下所示的输出是如何到达的? 排名对数据做了什么?
Input obj = pd.Series([7,-5,7,4,2,0,4])
输出:
print(obj)
0 7
1 -5
2 7
3 4
4 2
5 0
6 4
排名
print(obj.rank())
0 6.5
1 1.0
2 6.5
3 4.5
4 3.0
5 2.0
6 4.5
最佳答案
According to the official Pandas Documentation ,它执行以下操作:
Compute numerical data ranks (1 through n) along axis. Equal values are assigned a rank that is the average of the ranks of those values
这意味着基本上所有的值都会被分配一个“高分”。值 7 是最高的,因此获得最高排名,但由于值 7 出现两次,它都获得高分 7 和 6。但是由于值 7 不能有 2 个不同的“高分”,它被分配的平均值两个排名。 (6+7)/2 是 6.5 -> 这是数据值 7 的排名。其他值更直接,例如 -5 是最低的,因此排名最差。
关于python - Python 中的排名是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51396389/