python - 根据两列的值选择 Pandas 数据框行

我希望根据两个列值选择一些特定的行。例如:

d = {'user' : [1., 2., 3., 4] ,'item' : [5., 6., 7., 8.],'f1' : [9., 16., 17., 18.], 'f2':[4,5,6,5], 'f3':[4,5,5,8]}
df = pd.DataFrame(d)
print df

Out:
   f1  f2  f3  item  user
0   9   4   4     5     1
1  16   5   5     6     2
2  17   6   5     7     3
3  18   5   8     8     4

我想根据“用户”和“项目”的值选择行。给定一个存储 [user, item] 值对的 2d numpy 数组:

samples = np.array([[1,5],[3,7],[3,7],[2,6]]) 
Out: 
array([[1, 5],
       [3, 7],
       [3, 7],
       [2, 6]])

那么预期的输出是:

    Out:
   f1  f2  f3  item  user
0   9   4   4     5     1
2  17   6   5     7     3
2  17   6   5     7     3
1  16   5   5     6     2

然后，我的最终目标是得到一个 2d numpy 数组存储除 item 和 user 之外的所有列值，即:

Out: 
array([[9, 4, 4],
       [17, 6, 5],
       [17, 6, 5],
       [16, 5, 5]])

如我们所见，它是列 f1、f2、f3 的值。

我该怎么做？

最佳答案

如果您将 samples 设为包含列 user 和 item 的 DataFrame，那么您可以使用 inner join 获得所需的值.默认情况下，pd.merge 合并共享的 samples 和 df 的所有列——在这种情况下，这将是 用户 和项目。因此，

result = pd.merge(samples, df, how='inner')

产量

   user  item  f1  f2  f3
0     1     5   9   4   4
1     3     7  17   6   5
2     3     7  17   6   5
3     2     6  16   5   5

import numpy as np
import pandas as pd

d = {'user' : [1., 2., 3., 4] ,'item' : [5., 6., 7., 8.],'f1' : [9., 16., 17., 18.], 'f2':[4,5,6,5], 'f3':[4,5,5,8]}
df = pd.DataFrame(d)
samples = np.array([[1,5],[3,7],[3,7],[2,6]]) 
samples = pd.DataFrame(samples, columns=['user', 'item'])

result = pd.merge(samples, df, how='inner')
result = result[['f1', 'f2', 'f3']]
result = result.values
print(result)

产量

[[  9.   4.   4.]
 [ 17.   6.   5.]
 [ 17.   6.   5.]
 [ 16.   5.   5.]]

关于python - 根据两列的值选择 Pandas 数据框行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30582375/

python - 根据两列的值选择 Pandas 数据框行

上一篇：python - 如何打印每秒迭代次数？

下一篇：Python:如何检查两个列表是否不为空