python - 如何从具有数字索引和标题的数据框中获取最大值

标签 python sorting pandas

我有以下数据框:

df:

Unnamed: 0          0          1
0          0.0   0.000000        NaN
1          1.0   2.236068   0.000000
2          2.0   3.000000   2.236068
3          NaN   0.000000   1.000000
4          0.0   0.000000        NaN
5          1.0   1.414214   0.000000
6          2.0   2.828427   1.414214
7          NaN   0.000000   1.000000
8          0.0   0.000000        NaN
9          1.0   3.162278   0.000000
10         2.0  11.401754   3.162278
11         NaN   0.000000   1.000000
12         0.0   0.000000        NaN
13         1.0  14.142136   0.000000
14         2.0   2.828427  14.142136

我试图从每组数据中获取最大值,问题是我通过多次操作生成了这个数据帧,但最后索引和标题是数字,我不能使用groupbyloc. 我需要的是如下内容:

df1
        0
 1   3.000000
 2   2.828427
 3  11.401754
 4  14.142136

最佳答案

你绝对使用loc!问题是您没有注意 df.columns 是整数还是字符串。既然你遇到了问题,我猜是字符串。

但是,您想要做什么并不清楚

IIUC

m = df['0'] == 0
g = m.cumsum()[~m]
df.loc[~m, '0'].groupby(g).max()

关于python - 如何从具有数字索引和标题的数据框中获取最大值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44770505/

相关文章:

python - 创建子目录并根据文件名 PYTHON 对文件进行排序

java - 按特定顺序对包含字符串的 JTable 列进行排序

javascript - 用两个因素对数组进行排序 |分数和用时

python - pd.get_dummies 是单热编码吗?

python - 如何删除普通表格中的链接?

python - PyMC3 贝叶斯线性回归预测与 sklearn.datasets

python - 在python中查找列表的唯一元素的索引?

python - KMeans 聚类 - 使用 SVM 中创建的聚类

python - 如何根据日期列的 1 年滞后创建新的指标列?

Python Pandas 使用正则表达式从包含字符串的列中提取单词