我得到了这样的数据集(数据框):
x y
A a
A b
B c
C g
B g
这是我需要的多标签分类-
x y
A a,b
B c,g
C g
我该怎么办?
最佳答案
选项 1
将 groupby
与 ','.join
结合使用
df.groupby('x').y.apply(','.join).reset_index()
x y
0 A a,b
1 B c,g
2 C g
选项 2
将 pivot_table
与 ','.join
结合使用
df.pivot_table('y', 'x', aggfunc=','.join).reset_index()
x y
0 A a,b
1 B c,g
2 C g
关于python-3.x - 从冗余二进制数据集创建多标签数据集以进行多标签分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44400623/