我有一个如下所示的数据框 - 两列都是字符串,ValCol 是一串以逗号分隔的整数。该索引是一个没有意义的通用整数索引。
NameCol ValCol
Name1 555, 333
Name2 433
Name1 999
Name3 123
Name2 533
什么是最好的聚合方式
NameCol ValCol
Name1 555, 333, 999
Name2 433, 533
Name3 123
我不关心逗号分隔整数的顺序,但我确实需要在它们之间保留逗号。它可能是一个非常小的数据框,<100 条记录,因此效率并不重要。
我觉得应该有一些 groupby 方法来解决这个问题,但我还没有弄清楚。
最佳答案
使用 groupby
方法:
df = df.groupby('NameCol')['ValCol'].apply(', '.join).reset_index()
结果输出:
NameCol ValCol
0 Name1 555, 333, 999
1 Name2 433, 533
2 Name3 123
关于python - 将列值连接到 Pandas 中的行值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39277163/