<分区>
当我的 session 中存在多个数据帧的各种组合时,我需要一种聪明的方法来将它们连接在一起。通过连接完成事情的顺序无关紧要。
在这个简单的示例中,我有 4 个数据框,它们的每种组合在我的环境中可能存在也可能不存在。
例如,每个逗号分隔指的是表示 df1、df2、df3、df4 的数据帧。如果有帮助,我的数据框将始终具有这种类似的拼写。
我的数据框将始终连接到数据框中的“ID”字段。
示例场景设置(请记住,这有很多排列):
df1 = pd.DataFrame({'ID': ['jack', 'mary', 'jill'], 'Score1': [1,2,3]})
df3 = pd.DataFrame({'ID': ['jack', 'mary','katy'], 'Score3': [111,222,333]}
df4 = pd.DataFrame({'ID': ['jack', 'mary','katy'], 'Score4': [1111,2222,3333]}
下一次我可以只拥有 df1 和 df4...等等 如何设置数据框的进一步示例:
- 存在,存在,存在,存在
- 不,不,不,存在
- 不,不,存在,存在
- 没有,存在,存在,存在
- 等等....我相信是4! x 3!组合?总会有至少一个数据框,因为不会尝试连接
寻找解决方案:
df_final = df1.merge(.....) 用于可能存在或不存在的 df#s 的所有组合