python - 从与列的相同值匹配的两个数据帧中提取数据帧?

标签 python pandas

我有两个不同长度的数据帧。我想提取两个数据帧的“key1”值相同的数据。

In [6]: data1['key1'][5:10]
Out[6]: 
5    3701061.280649
6    3702854.401078
7    3706447.681452
8    3710048.323744
9    3713648.507167
Name: key1, dtype: float64

In [7]: data2['key1'][10:15]
Out[7]: 
10    3735249.951436
11    3738850.242555
12    3742450.472855
13    3746051.017456
14    3749651.185752
Name: key1, dtype: float64

我基本上希望从每个 data1 和 data2 中得到两个数据帧,这样我就可以绘制出“key2”(y 轴)与“key1”(x 轴)的差异

我怎样才能实现这个目标?

最佳答案

您可以使用isin,这将过滤掉其他 df 中列值中的列值,然后以相反的方式重复:

In [4]:

df = pd.DataFrame({'a':arange(10), 'b':randn(10)})
df1 = pd.DataFrame({'a':arange(2,12), 'b':randn(10)})
print(df)
print(df1)
   a         b
0  0 -0.255545
1  1 -1.550302
2  2 -0.825056
3  3  1.475839
4  4  0.059035
5  5  2.295766
6  6  1.604147
7  7 -1.877267
8  8 -0.462598
9  9 -1.347194
    a         b
0   2 -1.462567
1   3 -0.277680
2   4 -0.461539
3   5  1.094466
4   6 -1.086069
5   7  0.249207
6   8  2.613443
7   9  1.036450
8  10 -0.562149
9  11 -0.679488
In [6]:

df[df.a.isin(df1.a)]
Out[6]:
   a         b
2  2 -0.825056
3  3  1.475839
4  4  0.059035
5  5  2.295766
6  6  1.604147
7  7 -1.877267
8  8 -0.462598
9  9 -1.347194
In [7]:

df1[df1.a.isin(df.a)]
Out[7]:
   a         b
0  2 -1.462567
1  3 -0.277680
2  4 -0.461539
3  5  1.094466
4  6 -1.086069
5  7  0.249207
6  8  2.613443
7  9  1.036450

关于python - 从与列的相同值匹配的两个数据帧中提取数据帧?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25673767/

相关文章:

python - 如何将坐标从列表同时传递到多个步进电机,而不是按顺序?

python - 如何在不重新启动Python的情况下清空缓冲区

python - 用整数值索引 pandas 系列

python - 如何在 Keras API 中将数组列表作为输入

python - python 中缺少自动完成/转换的问题

python - 从字符串定义变量

python - Pandas:如何将字典映射到 2 列?

python - 处理各种货币字符串 pandas

Pandas 按一个热编码列分组

python - 更快地实现 pandas apply 功能