我有一个单词列表,假设它是
['a', 'b', 'c', 'd']
我有一个文档,其中我已经将文本文件预处理为矩阵,它是这样的:
a,b,c,d
0,1,1,0
1,1,0,0
1,1,1,1
其中 1 表示句子中出现该词,0 表示句子中不存在该词。我想逐行检查该矩阵,并增加与上面的原始单词列表相关的某种计数器,这样我就可以知道最后在句子中找到了多少个单词。
我该怎么做?我是否必须创建关联数组或二维数组?有没有办法在与我可以递增的每个单词关联的数组中创建一个新变量?
谢谢!
最佳答案
您所要做的就是对每一列求和
,因为它只是 0 和 1!
import numpy as np
array = numpy.array((matrix))
answer = np.apply_along_axis(sum,0,array[1::])
my_dict = dict(zip(matrix[0],answer))
现在你有了一本字典,其中键是单词,值是出现的总次数!
关于python - 我有一个单词列表。我想添加一个与每个单词关联的计数器变量。我该怎么做呢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16889082/