我有一个 pandas 数据框,其中包含日期和时间作为列。现在我想添加相同日期的小时数。例如,要这样做:
7-1-2016 | 4
7-1-2016 | 2
4-1-2016 | 5
进入此:
7-1-2016 | 6
4-1-2016 | 5
有没有一种快速的方法可以对大文件执行此操作?
最佳答案
这里GroupBy
可用于提供所需的输出。
DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False)
使用映射器(字典或键函数,将给定函数应用于组,以系列形式返回结果)或按一系列列对系列进行分组。
尝试:
df.groupby('date')['hours'].sum()
关于python - 在 pandas 数据框中添加具有相同列值的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34657183/