nlp - Spacy:计算每个句子中特定标记的出现次数

标签 nlp counter spacy find-occurrences spacy-3

我想使用 spacy 计算标记和语料库中每个句子的出现次数,并将每个句子的结果附加到列表中。到目前为止,下面的代码返回关于和的总数(对于整个语料库)。
3 个句子的示例/期望输出:['1', '0', '2']
电流输出:[3]

doc = nlp(corpus)
nb_and = []
for sent in doc.sents:
    i = 0
    for token in sent:
        if token.text == "and":
            i += 1
            nb_and.append(i)

最佳答案

您需要附加 inb_and处理完每个句子后:

for sent in doc.sents:
    i = 0
    for token in sent:
        if token.text == "and":
            i += 1
    nb_and.append(i)
测试代码:
import spacy
nlp = spacy.load("en_core_web_trf")
corpus = "I see a cat and a dog. None seems to be unhappy. My mother and I wanted to buy a parrot and a tortoise."
doc = nlp(corpus)
nb_and = []
for sent in doc.sents:
    i = 0
    for token in sent:
        if token.text == "and":
            i += 1
    nb_and.append(i)

nb_and
# => [1, 0, 2]

关于nlp - Spacy:计算每个句子中特定标记的出现次数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69831095/

相关文章:

artificial-intelligence - 用人工智能防止垃圾邮件

machine-learning - 如何将树编码为神经网络的输入?

nlp - 用 NLTK 检查英语语法

python - 查找每一列的唯一值

javascript - 如何将数据保存在本地html文件模因奖网页中,以允许计数器永久保存?

nlp - 在 spacy 中,是否可以在匹配的匹配中获取相应的规则 ID

python - 在 spaCy 中使用不同的 word2vec 训练数据

python - 用于文本提取的文档布局分析

c++ - C++整数奇/偶计数器问题

python - 我是否缺少 spaCy 词形还原中的预处理功能?