python - 在 Pandas 中分组数据框？

我对 python pandas 和使用数据帧还很陌生。假设我有如下所示的数据框:

我想找出我的数据框中有多少行在 A 列和 B 列中具有相同的值，并且我想为这些行存储 C 值。因此，例如在此数据框中，我想存储第一个和第三个 C 值，因为每一行中的 A 和 B 具有相同的值。基本上我想要一种打印类似的东西的方法: “对于 A = 3 和 B = 2，可能的 C 值是:3,1”并找到这些对。我正在关注官方 Pandas 文档，但我似乎找不到这个。

最佳答案

不确定我是否遵循，但这可能会让你继续:

df = DataFrame({"a": [3,4,3,5], "b":[2,2,2,6], "c": [3,4,1,6]})
In [38]: for i, g in df.groupby(("a", "b")):
             print  i, g["c"].values
         ....:
(3, 2) [3 1]
(4, 2) [4]
(5, 6) [6]

关于python - 在 Pandas 中分组数据框？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33680914/

上一篇：python - 使用值列表构建字符串

下一篇：基于条件的 Python 点语法函数

相关文章：

python - 使用 Pcapy 将数据包保存到 pcap 文件

python - Pandas 使用不同列连接数据帧 : AttributeError: 'NoneType' object has no attribute 'is_extension'

r - 如何根据 R 中预先指定的列对数据框进行分组

python - 在文本文件中查找模式(float +'\t' + float)

python - 导出 pip 包

python - Django channel 不会使用 CHANNEL_LAYERS 启动 redis 服务器

python - Pandas 熔化函数使用列索引位置而不是列名称

python - 像 python 字典一样迭代 Pandas 数据框

python - 如何在Python中将多级别的API响应转换为数据帧

python - pymongo 中的 collection.getIndexes() shell 命令的等价物是什么？