python - 将一列替换为属于两个不同数据框的另一列的值

标签 python pandas dataframe

我有两个数据框,如下所示:

import pandas as pd

d={'PART_NO': ['J661-03982','661-08913', '922-8972','661-00352','661-06291'], 'PART_NO_ENCODED': [541,1273,1110,1575,295]} 

suggest = pd.DataFrame(data=d)

d={'A': [1161,224, 505,1033,812], 'B': [957,417,440,588,910],'C':[392,167,97,70,703],'D':[187,2021,3437,2416,2117],'PART_NO':[541,1273,1110,1575,295]}

result = pd.DataFrame(data=d)

我想将结果数据框中的PART_NO替换为建议数据框中的PART_NO。我正在执行以下操作:

df4 = result.replace(suggest.set_index('PART_NO_ENCODED').to_dict()['PART_NO'])

df4 = df4[result.isin(suggest['PART_NO_ENCODED'].tolist())]

但是问题是,这替换了 PART_NO 的值,但使所有其他列 NaN 。如果我希望其他列值保持不变,并且仅将 PART_NO 替换为建议中的 PART_NO,如何解决此问题?

生成的数据框应如下所示:

d={'A': [1161,224, 505,1033,812], 'B': [957,417,440,588,910],'C':[392,167,97,70,703],'D':[187,2021,3437,2416,2117],'PART_NO':['J661-03982','661-08913', '922-8972','661-00352','661-06291']}

result = pd.DataFrame(data=d)

最佳答案

您可以首先使用 pd.merge 将列放入同一个 df 中。

import pandas as pd

d = {'PART_NO': ['J661-03982', '661-08913', '922-8972', '661-00352',
                 '661-06291'], 'PART_NO_ENCODED': [541, 1273, 1110, 1575, 295]}
suggest = pd.DataFrame(data=d)

d = {'A': [1161, 224, 505, 1033, 812], 'B': [957, 417, 440, 588, 910], 'C': [392, 167, 97,
                                                                             70, 703], 'D': [187, 2021, 3437, 2416, 2117], 'PART_NO': [541, 1273, 1110, 1575, 295]}
result = pd.DataFrame(data=d)

result['PART_NO_ENCODED'] = result['PART_NO']

df = pd.merge(result, suggest, on=['PART_NO_ENCODED'])
df = df.drop(['PART_NO_ENCODED', 'PART_NO_x'], axis=1).rename(columns={'PART_NO_y': 'PART_NO'})

输出:

      A    B    C     D     PART_NO
0  1161  957  392   187  J661-03982
1   224  417  167  2021   661-08913
2   505  440   97  3437    922-8972
3  1033  588   70  2416   661-00352
4   812  910  703  2117   661-06291

关于python - 将一列替换为属于两个不同数据框的另一列的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52012513/

相关文章:

python - numpy 用数组填充数组

python - Tkinter多处理不能泡菜

python - 数据是包含标题和小节的列,如何拆分它?

python - 按周分组一个 Dataframe

python - Pandas Dataframe 特殊计数

r - 收集 R 中相同组内的重叠坐标列

python - 如何在每天的特定时间持续运行Google Colaboratory?

python - 每当触发 else 语句时,如何在 for 循环中创建新列表

python - 将数字数据分组到分箱范围内

python - 更改 Pandas MultiIndex DataFrame 中的特定列值