pandas - 如何使用 pandas 根据一行标识符对合并列进行分组?

标签 pandas merge dataset

我有一个数据集,其中包含单个位置的许多条目。我试图找到一种方法来总结所有这些条目而不影响任何其他列。因此,以防万一我解释得不够好,我想使用这样的数据集:

Locations   Cyclists   maleRunners   femaleRunners   maleCyclists   femaleCyclists
Bedford     10         12            14              17             27
Bedford     11         40            34              9              1
Bedford     7          1             2               3              3
Leeds       1          1             2               0              0
Leeds       20         13            6               1              1
Bath        101        20            33              41             3
Bath        11         2             3               1              0

把它变成这样:

Locations   Cyclists   maleRunners   femaleRunners   maleCyclists   femaleCyclists
Bedford     28         53            50              29             31
Leeds       21         33            39              1              1
Bath        111        22            36              42             3

现在,我已经读到 groupby 应该以某种方式工作,但根据我的理解,group by 会将其更改为 2 列,我并不特别想制作数百个 2 列,然后将其全部合并。当然有更简单的方法来做到这一点吗?

最佳答案

IIUC、groupby+sum 适合您:

df.groupby('Locations',as_index=False,sort=False).sum()

输出:

  Locations  Cyclists  maleRunners  femaleRunners  maleCyclists  femaleCyclists
0   Bedford        28           53             50            29              31
1     Leeds        21           14              8             1               1
2      Bath       112           22             36            42               3

关于pandas - 如何使用 pandas 根据一行标识符对合并列进行分组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63291382/

相关文章:

pandas 要分组的数据框列表

tfs - 如何使用 TFS 执行功能分支策略

java - 使用 PDFBox 合并 Pdf 文件

python - 循环并合并以创建新列表

dataset - 在哪里可以找到易于以编程方式读取/使用的人体解剖学数据集

python - pandas.read_csv 命名参数 na_values 默认值

python - 如何使用 Pandas 中的多列映射函数?

python - Pandas 检查时间序列的连续性

scala - Spark DataFrames/Datasets 在缓存时共享数据吗?

sql-server - SQL Server R 多个结果集