我有两个数据框,它们的形状是 (707
,140
) 和 (34
,98
)。
我想根据相同的索引名称和列名称将较大的数据框最小化为较小的数据框。
因此,从更大的数据框中删除额外的行和列后,最终其形状应为 (34
,98
),具有相同的索引和列小数据框。
如何在 python 中执行此操作?
最佳答案
我想你可以通过loc
来选择小DataFrame
的索引
和列
:
dfbig.loc[dfsmall.index, dfsmall.columns]
示例:
dfbig = pd.DataFrame({'a':[1,2,3,4,5], 'b':[4,7,8,9,4], 'c':[5,0,1,2,4]})
print (dfbig)
a b c
0 1 4 5
1 2 7 0
2 3 8 1
3 4 9 2
4 5 4 4
dfsmall = pd.DataFrame({'a':[4,8], 'c':[0,1]})
print (dfsmall)
a c
0 4 0
1 8 1
print (dfbig.loc[dfsmall.index, dfsmall.columns])
a c
0 1 5
1 2 0
关于python - 将 Pandas 数据框缩减为其他数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39559603/