python - 将 Pandas 数据框缩减为其他数据框

标签 python pandas dataframe multiple-columns

我有两个数据框,它们的形状是 (707,140) 和 (34,98 )。

我想根据相同的索引名称和列名称将较大的数据框最小化为较小的数据框。

因此,从更大的数据框中删除额外的行和列后,最终其形状应为 (34,98),具有相同的索引和列小数据框。

如何在 python 中执行此操作?

最佳答案

我想你可以通过loc来选择小DataFrame索引:

dfbig.loc[dfsmall.index, dfsmall.columns]

示例:

dfbig = pd.DataFrame({'a':[1,2,3,4,5], 'b':[4,7,8,9,4], 'c':[5,0,1,2,4]})
print (dfbig)
   a  b  c
0  1  4  5
1  2  7  0
2  3  8  1
3  4  9  2
4  5  4  4

dfsmall = pd.DataFrame({'a':[4,8], 'c':[0,1]})
print (dfsmall)
   a  c
0  4  0
1  8  1

print (dfbig.loc[dfsmall.index, dfsmall.columns])
   a  c
0  1  5
1  2  0

关于python - 将 Pandas 数据框缩减为其他数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39559603/

相关文章:

python - 是否可以将 TransformedTargetRegressor 添加到 scikit-learn 管道中?

python - 是否有将数据帧的某些值写入 Python 中的 .txt 文件的函数?

r - 当列为 num 时,列被错误标记为 int

python - 来自 Pandas 数据框的共现矩阵

python - Groupby 和 sum 行以聚合 PRODUCT 列的多个值

python - Pandas 中的命名变换

python - 删除列表中小于 3 位的数字,同时项目数量保持不变

python - python 中本地主机上的 HTTP 删除请求

python - 我用python写了一个文件下载器,如果出现错误404则无法跳过

python - GridSearchCV 和 Google colab : n_jobs=-1 does not work