pandas - 如何使用 pandas 根据一行标识符对合并列进行分组？

我有一个数据集，其中包含单个位置的许多条目。我试图找到一种方法来总结所有这些条目而不影响任何其他列。因此，以防万一我解释得不够好，我想使用这样的数据集:

Locations   Cyclists   maleRunners   femaleRunners   maleCyclists   femaleCyclists
Bedford     10         12            14              17             27
Bedford     11         40            34              9              1
Bedford     7          1             2               3              3
Leeds       1          1             2               0              0
Leeds       20         13            6               1              1
Bath        101        20            33              41             3
Bath        11         2             3               1              0

把它变成这样:

Locations   Cyclists   maleRunners   femaleRunners   maleCyclists   femaleCyclists
Bedford     28         53            50              29             31
Leeds       21         33            39              1              1
Bath        111        22            36              42             3

现在，我已经读到 groupby 应该以某种方式工作，但根据我的理解，group by 会将其更改为 2 列，我并不特别想制作数百个 2 列，然后将其全部合并。当然有更简单的方法来做到这一点吗？

最佳答案

IIUC、groupby+sum 适合您:

df.groupby('Locations',as_index=False,sort=False).sum()

输出:

  Locations  Cyclists  maleRunners  femaleRunners  maleCyclists  femaleCyclists
0   Bedford        28           53             50            29              31
1     Leeds        21           14              8             1               1
2      Bath       112           22             36            42               3

关于pandas - 如何使用 pandas 根据一行标识符对合并列进行分组？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63291382/

上一篇：elixir - `virtual: true` 对嵌入式架构有影响吗？

下一篇：gnuplot:添加偏移量时绘制 pm3d 工件

相关文章：

pandas 要分组的数据框列表

tfs - 如何使用 TFS 执行功能分支策略

java - 使用 PDFBox 合并 Pdf 文件

python - 循环并合并以创建新列表

dataset - 在哪里可以找到易于以编程方式读取/使用的人体解剖学数据集

python - pandas.read_csv 命名参数 na_values 默认值

python - 如何使用 Pandas 中的多列映射函数？

python - Pandas 检查时间序列的连续性

scala - Spark DataFrames/Datasets 在缓存时共享数据吗？

sql-server - SQL Server R 多个结果集