我对 python pandas 和使用数据帧还很陌生。假设我有如下所示的数据框:
A B C
3 2 3
4 2 4
3 2 1
5 6 6
我想找出我的数据框中有多少行在 A 列和 B 列中具有相同的值,并且我想为这些行存储 C 值。因此,例如在此数据框中,我想存储第一个和第三个 C 值,因为每一行中的 A 和 B 具有相同的值。基本上我想要一种打印类似的东西的方法: “对于 A = 3 和 B = 2,可能的 C 值是:3,1”并找到这些对。 我正在关注官方 Pandas 文档,但我似乎找不到这个。
最佳答案
不确定我是否遵循,但这可能会让你继续:
df = DataFrame({"a": [3,4,3,5], "b":[2,2,2,6], "c": [3,4,1,6]})
In [38]: for i, g in df.groupby(("a", "b")):
print i, g["c"].values
....:
(3, 2) [3 1]
(4, 2) [4]
(5, 6) [6]
关于python - 在 Pandas 中分组数据框?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33680914/