python - 带有 BERT 的 NER 的合并输出与序列输出

标签 python nlp

将合并的输出用于句子级别的分析(例如分类)是有道理的。我想知道, token 级别嵌入是否更适合命名实体识别?我会这么想,但我不确定如何为 NER 获取序列输出和操作。我是否只为 [batch_size, num_tokens, 768] 取一片 [:, :, -1]

最佳答案

如果我们谈论 bert,我们会得到两个输出

o1, o2 = self.bert(ids, attention_mask=mask)

  • o1-顺序输出:每个标记都会收到自己的嵌入(可用于 NER Pooled 输出。)
  • o2-池化输出:整个句子接受嵌入。 (可用于分类问题)

在前向传播中,您可以根据您的用例进一步修改 bert 输出。

关于python - 带有 BERT 的 NER 的合并输出与序列输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60386576/

相关文章:

nlp - 在 openAI 提示符下处理 80 多个函数调用的好策略是什么

python - 如何让 POS n-gram 更有效?

python - 如何hstack numpy记录数组?

python - Altair choropleth map ,基于折线图选择的颜色突出显示

python - 如何填充图像中的孔

python - 是否可以将 spacy 与已经标记化的输入一起使用?

python - Trie 实现的内存高效数据结构

python - Django 应用程序尚未加载 Celery 任务

python - Python 中的定时器

python - 获取由 spacy 解析器创建的每个 token 的 Spacy.Vocab.Morphology id