python - 将 Excel 中的多列合并为 pandas 中的一列

标签 python pandas

我有一个像这样的 pandas 数据框:

    Column1  Column2      
 0    a        jack       
 1    a        peter      
 2    b        anna     
 3    c        rose                     
 4    c        pupp

我现在想做的是获取一个包含Column1和第2列的新数据框,如果row1 == row2,则第2列应该得到,然后打印第2列的值,输出应该是这样的

 Column1    Column2

0   a      jack,peter    
1   b      anna
2   c      rose,pupp

我怎样才能最好地解决这个问题?任何意见将是有益的。提前致谢!

最佳答案

我认为需要groupby加入:

df = df.groupby('Column1')['Column2'].apply(', '.join).reset_index()
print (df)
  Column1      Column2
0       a  jack, peter
1       b         anna
2       c   rose, pupp

关于python - 将 Excel 中的多列合并为 pandas 中的一列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51257883/

相关文章:

Python - 自动调整excel文件列的宽度

python - 使用 Pywinauto 自动化 ABBYY,我得到 "ElementNotFoundError"

python - 在这个非常基本的代码中,我无法弄清楚第6行的语法错误是(python)

python - django smart_selects - syncdb 错误

Pandas groupby agg 应用具有多个参数的函数

python - 将 pandas 数据框保存为 csv 并覆盖现有文件

python - 使用 Dataframe 进行多处理和队列

python - 合并列不匹配的 pandas 数据框

python - 用年份绘制 pandas 数据框

python - 仅转置 pandas MultiIndex 数据帧的一个级别