我正在尝试在 pandas 中做一些应该非常简单的事情,但看起来却并非如此。我正在尝试向现有的 pandas 数据框添加一列,该数据框是基于另一个(现有)列的映射值。这是一个小测试用例:
import pandas as pd
equiv = {7001:1, 8001:2, 9001:3}
df = pd.DataFrame( {"A": [7001, 8001, 9001]} )
df["B"] = equiv(df["A"])
print(df)
我希望会出现以下结果:
A B
0 7001 1
1 8001 2
2 9001 3
相反,我收到一条错误消息,告诉我 equal 不是可调用函数。公平地说,它是一本字典,但即使我将它包装在一个函数中,我仍然感到沮丧。因此,我尝试使用似乎可以与其他操作一起使用的 map 函数,但它也被使用字典所击败:
df["B"] = df["A"].map(lambda x:equiv[x])
在这种情况下,我只是得到 KeyError: 8001。我已经阅读了文档和以前的帖子,但尚未遇到任何建议如何将字典与 pandas 数据帧混合的内容。任何建议将不胜感激。
最佳答案
正确的做法是df["B"] = df["A"].map(equiv)
。
In [55]:
import pandas as pd
equiv = {7001:1, 8001:2, 9001:3}
df = pd.DataFrame( {"A": [7001, 8001, 9001]} )
df["B"] = df["A"].map(equiv)
print(df)
A B
0 7001 1
1 8001 2
2 9001 3
[3 rows x 2 columns]
它会很好地处理 key 不存在的情况,考虑以下示例:
In [56]:
import pandas as pd
equiv = {7001:1, 8001:2, 9001:3}
df = pd.DataFrame( {"A": [7001, 8001, 9001, 10000]} )
df["B"] = df["A"].map(equiv)
print(df)
A B
0 7001 1
1 8001 2
2 9001 3
3 10000 NaN
[4 rows x 2 columns]
关于python - 添加一个新的 pandas 列,其中包含字典中的映射值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53822478/