所以我用 MultiIndex 创建了一个数据框
df = pd.DataFrame({
'C1': ['x', 'x', 'y', 'y', 'z', 'z'],
'C2': ['a', 'b', 'a', 'b', 'a', 'b'],
'C3': [10, 11, 12, 13, 14, 15]})
df.set_index(['C1', 'C2'], inplace=True)
我得到以下数据框
C3
C1 C2
x a 10
b 11
y a 12
b 13
z a 14
b 15
我也有一个索引为 C2
的系列:
series = pd.Series([100], index=['a'])
我想将这个系列分配给新列 C4
,仅分配给“x”第一个索引。如果我使用 .assign
它会工作,但它会返回一个副本:
df.loc['x'].assign(C4=series)
我得到
C3 C4
C2
a 10 100.0
b 11 NaN
但我无法将其分配给原始数据
df.loc['x'] = df.loc['x'].assign(C4=series)
产量
C3
C1 C2
x a NaN
b NaN
如果我使用这样的赋值,我会得到相同的结果:
df.loc['x', 'C4'] = series
但它会产生 NaN。
C3 C4
C1 C2
x a NaN NaN
b NaN NaN
y a 12.0 NaN
b 13.0 NaN
z a 14.0 NaN
b 15.0 NaN
如何分配?
最佳答案
你可以去 pd.IndexSlice
即
df.loc[pd.IndexSlice['x',series.index.tolist()],'C4'] = series.values
C3 C4
C1 C2
x a 10 100.0
b 11 NaN
y a 12 NaN
b 13 NaN
z a 14 NaN
b 15 NaN
关于python - Pandas 将系列分配给多索引的新列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50992000/