我是 pandas 新用户,我想问一下可以这样做吗?
这是我的数据框的示例。这两个属性的所有数据类型都是字符串。
id class
A1 X1,41
A1 X1,42
A1 X1,43
A2 X1,41
A2 X1,45
我已经使用groupby合并了数据框,结果是这样的。 df = df.groupby(['id']).sum()
id class
A1 X1,41X1,42X1,43
A2 X1,41X1,45
但我希望结果是这样的(希望数据以列表的形式包含。)
id class
A1 [X1,41], [X1,42], [X1,43]
A2 [X1,41], [X1,45]
最佳答案
我认为您正在寻找这个:
df.groupby('id').apply(lambda x: [[_x] for _x in x['class']])
这意味着按 'id'
列进行分组,并对每个分组对象应用给定的函数。在本例中,我提供了一个函数,用于创建该 groupby 对象中的对象列表的列表。 _x
可以是任何东西,我只是将其命名为反射(reflect)它是临时的和占位符。
关于python - 是否可以在 pandas 数据框中格式化字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53192492/