我有两个 DataFrame。 df1
是多索引,df2
是标准索引。如何通过在 df2.index
和 df1.get
的每次匹配中重复来自 df2
的值来合并它们。
例子
import pandas as pd
import numpy as np
idx1 = pd.MultiIndex.from_product([['bar', 'baz', 'foo'],['one','two']])
idx2 = ['bar', 'baz']
df1 = pd.DataFrame(np.random.randn(6, 2), index=idx1, columns=['A', 'B'])
df2 = pd.DataFrame(np.random.randn(2, 1), index=idx2, columns=['C'])
如果df1
是
A B
bar one 0.690827 -0.627957
two -0.080936 -1.330712
baz one 1.395178 -0.099748
two -0.116789 0.723990
foo one 0.313067 0.853808
two 0.409727 -0.529002
和df2
是
C
bar -0.773924
baz 0.099662
如何获取merge like?
A B C
bar one 0.690827 -0.627957 -0.773924
two -0.080936 -1.330712 -0.773924
baz one 1.395178 -0.099748 0.099662
two -0.116789 0.723990 0.099662
foo one 0.313067 0.853808 NaN
two 0.409727 -0.529002 NaN
最佳答案
您可以为索引命名并在合并中使用它,而无需像下面那样重新索引或重置索引
df1.index.set_names(["id_1", "id_2"], inplace=True)
df1.merge(df2, left_on="id_1", right_index=True, how="left")
结果
A B C
id_1 id_2
bar one 0.690827 -0.627957 -0.773924
two -0.080936 -1.330712 -0.773924
baz one 1.395178 -0.099748 0.099662
two -0.116789 0.723990 0.099662
foo one 0.313067 0.853808 NaN
two 0.409727 -0.529002 NaN
关于python - 如何合并 `pandas` 中的部分多索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58356559/