python - 将 SpaCy 的 EntityRecognizer 应用于 Pandas 数据框中的列

标签 python pandas dataframe nlp spacy

我有一个基于文本的数据集,我希望将 SpaCy 的 EntityRecognizer 应用于特定列的每一行。

我可以通过执行以下操作来应用通用 spaCy 管道:

df['new_col'] = df['col'].apply(lambda x: nlp(x))

如何仅应用实体识别器并获取其值?

最佳答案

在 Spacy 中,文档有一个属性 .ents,它会在其命名实体上返回生成器。

所以你可以使用:

df['new_col'] = df['col'].apply(lambda x: list(nlp(x).ents))

关于python - 将 SpaCy 的 EntityRecognizer 应用于 Pandas 数据框中的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51432641/

相关文章:

python - 以秒为单位的转换时间戳值不会反转为 python 中的原始时间戳

python - 比较两个电子表格并提取值

python - Pandas 数据框到列表字典

arrays - Pandas 如何对齐 DataFrame 中的两列和 NaN 空单元格

python - Pandas to_excel 不写换行符

python - 为什么在递归函数中返回 matplotlib 图形对象时会绘制额外的空白图形?

python - 如何重定向?映射? Django 中的网址

Python Pandas 根据条件更改值

r - 按变量拆分 data.frame 并应用引用具体行的函数

python - Pyserial 什么时候应该使用 flush?