我有两个数据帧df1
和df2
。我想将 df1
中的所有列与 df2
中的 2 列连接起来。
print(df1.shape[0])
# 344
print(df2.shape[0])
# 3577
df3 = pd.merge(df1, df2[['latitude', 'longitude', 'code']],
how ='left', left_on=['LOCATION'], right_on=['code'])
print(df3.shape[0])
# 1740
在我的输出数据框中,我只需要 df1
中的 344 条记录以及 df2
中的列。
我的代码有什么问题?
最佳答案
第二个数据帧(df2)
具有重复的值,这导致了问题。我删除了重复的值并加入了 df1 和 df2。现在可以了。
关于python - Pandas Join 未提供确切的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58897981/