python - 添加一个新的 pandas 列,其中包含字典中的映射值

标签 python pandas

我正在尝试在 pandas 中做一些应该非常简单的事情,但看起来却并非如此。我正在尝试向现有的 pandas 数据框添加一列,该数据框是基于另一个(现有)列的映射值。这是一个小测试用例:

import pandas as pd
equiv = {7001:1, 8001:2, 9001:3}
df = pd.DataFrame( {"A": [7001, 8001, 9001]} )
df["B"] = equiv(df["A"])
print(df)

我希望会出现以下结果:

      A   B
0  7001   1
1  8001   2
2  9001   3

相反,我收到一条错误消息,告诉我 equal 不是可调用函数。公平地说,它是一本字典,但即使我将它包装在一个函数中,我仍然感到沮丧。因此,我尝试使用似乎可以与其他操作一起使用的 map 函数,但它也被使用字典所击败:

df["B"] = df["A"].map(lambda x:equiv[x])

在这种情况下,我只是得到 KeyError: 8001。我已经阅读了文档和以前的帖子,但尚未遇到任何建议如何将字典与 pandas 数据帧混合的内容。任何建议将不胜感激。

最佳答案

正确的做法是df["B"] = df["A"].map(equiv)

In [55]:

import pandas as pd
equiv = {7001:1, 8001:2, 9001:3}
df = pd.DataFrame( {"A": [7001, 8001, 9001]} )
df["B"] = df["A"].map(equiv)
print(df)
      A  B
0  7001  1
1  8001  2
2  9001  3

[3 rows x 2 columns]

它会很好地处理 key 不存在的情况,考虑以下示例:

In [56]:

import pandas as pd
equiv = {7001:1, 8001:2, 9001:3}
df = pd.DataFrame( {"A": [7001, 8001, 9001, 10000]} )
df["B"] = df["A"].map(equiv)
print(df)
       A   B
0   7001   1
1   8001   2
2   9001   3
3  10000 NaN

[4 rows x 2 columns]

关于python - 添加一个新的 pandas 列,其中包含字典中的映射值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53822478/

相关文章:

python - 错误 : Package: python-devel-2. 6.6-64.el6.x86_64 需要 : python-libs(x86-64) = 2. 6.6-64.el6 找到 : python-libs-2. 6.6-66.el6_8.x86_64

python - 如何使用 groupby 仅考虑特定行来计算中位数

python - Dataframe groupby - 值列表

python - 如何修复 "OverflowError: Unsupported UTF-8 sequence length when encoding string"

python - pandas groupby 并聚合到新列中

python - 将 CSV 文件与选定列合并

python - 在 PyQt 中将图像添加到 QTableWidget

python - 使用标签计数构建数据框

python - 类型错误 : 'NoneType' object is not callable (Python: Scraping from HTML data)

python - 如何在 python 中使用 opencv 按下按键时准确地从相机流中捕获帧?