python - 如何根据另一列中的值是否包含在另一个数据帧的特定列中来设置一个数据帧的列值

标签 python python-3.x pandas merge anaconda

如何根据数据帧的另一列中的值是否包含在另一个数据帧的特定列中来设置数据帧的一列的值。如果包含,则数字为 1,如果不包含,则为 0。例如:我有两个数据框:

a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6]} 


TableB= {'name': ['Braund', 'Cummings', 'Heikkinen', 'Allen','Mary','Celina','Roger'],
'age': [22,38,26,35,41,22,38],
'fare': [7.25, 71.83, 0 , 8.05,7,6.05,6], 
'survived?': [False, True, True, False, True, False, True]}

我想检查a的'age'列中的每个数字是否都包含在TableB的'age'列中,如果包含,则在a中添加一列'Observer'并将值设置为1,如果没有,0。

I have tried this:

a['age'].isin(TableB['age'].set_value('Observer',1)

预期结果如下,但我的结果是a的observer列的值全部为1。

a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6],'observer':[1,1,1,0,0,0]}

最佳答案

a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6]} 
a = pd.DataFrame(a)
print (a)
   age  no
0   22   1
1   38   2
2   26   3
3   62   4
4  198   5
5   27   6

TableB= {'name': ['Braund', 'Cummings', 'Heikkinen', 'Allen','Mary','Celina','Roger'],
'age': [22,38,26,35,41,22,38],
'fare': [7.25, 71.83, 0 , 8.05,7,6.05,6], 
'survived?': [False, True, True, False, True, False, True]}

TableB = pd.DataFrame(TableB)
print (TableB)
        name  age   fare  survived?
0     Braund   22   7.25      False
1   Cummings   38  71.83       True
2  Heikkinen   26   0.00       True
3      Allen   35   8.05      False
4       Mary   41   7.00       True
5     Celina   22   6.05      False
6      Roger   38   6.00       True

您可以将 bool 掩码转换为整数,以将 True/False 映射到 1/0:

a['observer'] = a['age'].isin(TableB['age']).astype(int)

替代解决方案是使用numpy.where :

a['observer'] = np.where(a['age'].isin(TableB['age']), 1, 0)
print (a)
   age  no  observer
0   22   1         1
1   38   2         1
2   26   3         1
3   62   4         0
4  198   5         0
5   27   6         0

如果使用字典,则使用带有 if-else 的列表理解,并通过 in 测试成员资格:

a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6]} 

TableB= {'name': ['Braund', 'Cummings', 'Heikkinen', 'Allen','Mary','Celina','Roger'],
'age': [22,38,26,35,41,22,38],
'fare': [7.25, 71.83, 0 , 8.05,7,6.05,6], 
'survived?': [False, True, True, False, True, False, True]}


a['observer'] = [1 if x in TableB['age'] else 0 for x in a['age']]
print (a)
{'age': [22, 38, 26, 62, 198, 27], 'no': [1, 2, 3, 4, 5, 6], 'observer': [1, 1, 1, 0, 0, 0]}

关于python - 如何根据另一列中的值是否包含在另一个数据帧的特定列中来设置一个数据帧的列值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57986006/

相关文章:

python - Pandas 时间序列的线性回归

python - 如何在 Pandas 数据框中将单元格设置为 NaN

python - 使用Python和请求抓取网页时的字符集问题

基于Python的简单计时器脚本无法正常工作

python - 带 ILU 预处理器的一般最小残差 (GMRES)

python-3.x - 创建一个新列,在同一行上使用最少的其他列

python - 我们如何使用回调和提供数据框的函数动态地在 Dash Table 中创建数据列

python - 如何在列表中以二进制前导 0b 为下标

python - 如何旋转 python turtle 对象

python - C++ 到 Python 初学者