python - 迭代数据帧时出现未知值

标签 python machine-learning nlp nltk

我正在使用性别猜测器库来根据名字猜测性别。

import gender_guesser.detector as gender
 d = gender.Detector()

 print(d.get_gender(u"Bob"))
 male
gen = ['Alice', 'Bob', 'Kattie', "Jean", "Gabriel"]
female
male
female
male
male

但是当我尝试在 pandas 数据帧上迭代它时,我得到的输出为未知

for name in df1['first_name'].iteritems():
print(d.get_gender(name))

最佳答案

一种方法是使用 map 。

df1['gender'] = df1['first_name'].map(lambda x: d.get_gender(x))

它将创建一个名为“性别”的新列。我认为它应该比 iteritems 更快。

关于python - 迭代数据帧时出现未知值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52879247/

相关文章:

python - Pandas df 根据整数索引列表对行和列重新排序

machine-learning - MNIST 手写数字数据集 - 已解码版本?

python - 如何使用未标记的数据集进行序列标记

Java 斯坦福 NLP : Part of Speech labels?

machine-learning - 我的公报上的实体无法识别

python - 如何解决安装构建工具的问题

python - 计算 numpy 数组 python 中字符串出现次数的更快方法

python:不可变的私有(private)类变量?

tensorflow - 文本嵌入层之后池化层的目的

java - 具有字符串属性的 WEKA 决策树