我有两个数据框,如下所示:
import pandas as pd
d={'PART_NO': ['J661-03982','661-08913', '922-8972','661-00352','661-06291'], 'PART_NO_ENCODED': [541,1273,1110,1575,295]}
suggest = pd.DataFrame(data=d)
和
d={'A': [1161,224, 505,1033,812], 'B': [957,417,440,588,910],'C':[392,167,97,70,703],'D':[187,2021,3437,2416,2117],'PART_NO':[541,1273,1110,1575,295]}
result = pd.DataFrame(data=d)
我想将结果数据框中的PART_NO
替换为建议数据框中的PART_NO
。我正在执行以下操作:
df4 = result.replace(suggest.set_index('PART_NO_ENCODED').to_dict()['PART_NO'])
df4 = df4[result.isin(suggest['PART_NO_ENCODED'].tolist())]
但是问题是,这替换了 PART_NO
的值,但使所有其他列 NaN
。如果我希望其他列值保持不变,并且仅将 PART_NO
替换为建议中的 PART_NO
,如何解决此问题?
生成的数据框应如下所示:
d={'A': [1161,224, 505,1033,812], 'B': [957,417,440,588,910],'C':[392,167,97,70,703],'D':[187,2021,3437,2416,2117],'PART_NO':['J661-03982','661-08913', '922-8972','661-00352','661-06291']}
result = pd.DataFrame(data=d)
最佳答案
您可以首先使用 pd.merge
将列放入同一个 df
中。
import pandas as pd
d = {'PART_NO': ['J661-03982', '661-08913', '922-8972', '661-00352',
'661-06291'], 'PART_NO_ENCODED': [541, 1273, 1110, 1575, 295]}
suggest = pd.DataFrame(data=d)
d = {'A': [1161, 224, 505, 1033, 812], 'B': [957, 417, 440, 588, 910], 'C': [392, 167, 97,
70, 703], 'D': [187, 2021, 3437, 2416, 2117], 'PART_NO': [541, 1273, 1110, 1575, 295]}
result = pd.DataFrame(data=d)
result['PART_NO_ENCODED'] = result['PART_NO']
df = pd.merge(result, suggest, on=['PART_NO_ENCODED'])
df = df.drop(['PART_NO_ENCODED', 'PART_NO_x'], axis=1).rename(columns={'PART_NO_y': 'PART_NO'})
输出:
A B C D PART_NO
0 1161 957 392 187 J661-03982
1 224 417 167 2021 661-08913
2 505 440 97 3437 922-8972
3 1033 588 70 2416 661-00352
4 812 910 703 2117 661-06291
关于python - 将一列替换为属于两个不同数据框的另一列的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52012513/