python - 我有一个单词列表。我想添加一个与每个单词关联的计数器变量。我该怎么做呢?

标签 python arrays list

我有一个单词列表,假设它是

['a', 'b', 'c', 'd']

我有一个文档,其中我已经将文本文件预处理为矩阵,它是这样的:

a,b,c,d
0,1,1,0
1,1,0,0
1,1,1,1

其中 1 表示句子中出现该词,0 表示句子中不存在该词。我想逐行检查该矩阵,并增加与上面的原始单词列表相关的某种计数器,这样我就可以知道最后在句子中找到了多少个单词。

我该怎么做?我是否必须创建关联数组或二维数组?有没有办法在与我可以递增的每个单词关联的数组中创建一个新变量?

谢谢!

最佳答案

您所要做的就是对每一列求和,因为它只是 0 和 1!

import numpy as np
array = numpy.array((matrix))
answer = np.apply_along_axis(sum,0,array[1::])
my_dict = dict(zip(matrix[0],answer))

现在你有了一本字典,其中键是单词,值是出现的总次数!

关于python - 我有一个单词列表。我想添加一个与每个单词关联的计数器变量。我该怎么做呢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16889082/

相关文章:

python - 从列表中获取所有最小元素及其索引

python - Google App Engine - 使用 URLFetch 的基本 Cookie 处理

javascript - 将脚本 src 存储在数组中

php - 使用数组抓取 MYSQL 的所有行

java - 如何在 Java 中按元素大小对 ArrayList 进行排序?

python - 如何迭代两个字典并将它们保存在python列表中

python - 如何从 Pandas 数据框中的另一列所有值和聚合中的另一列创建新列名称?

python - 为循环编写 python 为 while?

python - 使用python替换url中的端口

c - 用 C 从文件中读取行和列