python - 在 Pandas 中分组数据框?

标签 python pandas dataframe

我对 python pandas 和使用数据帧还很陌生。假设我有如下所示的数据框:

A B C

3 2 3
4 2 4
3 2 1 
5 6 6

我想找出我的数据框中有多少行在 A 列和 B 列中具有相同的值,并且我想为这些行存储 C 值。因此,例如在此数据框中,我想存储第一个和第三个 C 值,因为每一行中的 A 和 B 具有相同的值。基本上我想要一种打印类似的东西的方法: “对于 A = 3 和 B = 2,可能的 C 值是:3,1”并找到这些对。 我正在关注官方 Pandas 文档,但我似乎找不到这个。

最佳答案

不确定我是否遵循,但这可能会让你继续:

df = DataFrame({"a": [3,4,3,5], "b":[2,2,2,6], "c": [3,4,1,6]})
In [38]: for i, g in df.groupby(("a", "b")):
             print  i, g["c"].values
         ....:
(3, 2) [3 1]
(4, 2) [4]
(5, 6) [6]

关于python - 在 Pandas 中分组数据框?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33680914/

相关文章:

python - 使用 Pcapy 将数据包保存到 pcap 文件

python - Pandas 使用不同列连接数据帧 : AttributeError: 'NoneType' object has no attribute 'is_extension'

r - 如何根据 R 中预先指定的列对数据框进行分组

python - 在文本文件中查找模式(float +'\t' + float)

python - 导出 pip 包

python - Django channel 不会使用 CHANNEL_LAYERS 启动 redis 服务器

python - Pandas 熔化函数使用列索引位置而不是列名称

python - 像 python 字典一样迭代 Pandas 数据框

python - 如何在Python中将多级别的API响应转换为数据帧

python - pymongo 中的 collection.getIndexes() shell 命令的等价物是什么?