python - 如何根据特定列值从总计值中创建新的数据框?

标签 python pandas dataframe

假设我有一个如下所示的数据框:

A  B  C
X  U  500
X  S  300
X  T  200
Y  F  20
Y  G  980
Z  L  400

我想在 A 列中使用特定值,因此 {X, Y, Y} 并根据这些值,我想获取 C 行总和并将其输出到新的数据帧中。我的新数据框应该像这样

A  B
X  1000
Y  1000
Z  400

它本质上是按 A 列中的名称对值进行分组,从 A 中的每个值中获取 C 的总和,并使用 A 列中指定的名称和 C 列中的总计创建一个新的数据框。

我需要它自己获取这些值,因为想象我的数据框有 200 行,A 列中有 80 个不同的值。

最佳答案

用途:

df = df.groupby('A', as_index=False)['B'].sum()

或者:

df = df.groupby('A')['B'].sum().reset_index()

关于python - 如何根据特定列值从总计值中创建新的数据框?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44545976/

相关文章:

python - 在 Tomcat 上安装 CGI 代理

python - 从文本文件中删除空白行

python - 是否有一种简洁的方法可以仅针对当前命令显示 pandas 中的所有行?

python - 使用pandas过滤excel数据时出现KeyError

python - 如何将 Python Pandas Dataframe 转换为 R data.frame

r - 在数据框列中的 “/”之后提取文本

Python 无法解析带有额外尾随逗号的 JSON

python - PySpark 应用程序失败,出现 java.lang.OutOfMemoryError : Java heap space

python - 如何将带有文本信息的1.3 GB csv文件读取到Python的pandas对象中?

r - 如何修改嵌套在列表内的数据框而不重新分配