python - 计算单词和字符串的频率

标签 python

我需要计算句子中的单词数。我用

来做
word_matrix[i][j] = sentences[i].count([*words_dict][j])

但是当一个单词包含在另一个单词中时它也很重要,例如“in”包含在“interactive”中。如何避免?

最佳答案

您可以使用collections.Counter为此:

from collections import Counter
s = 'This is a sentence'

Counter(s.lower().split())

# Counter({'this': 1, 'is': 1, 'a': 1, 'sentence': 1})

关于python - 计算单词和字符串的频率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54631463/

相关文章:

python - 根据条件将一列拆分为多列

python - 如何使用 PyCurl 设置 GET 参数?

python - 选择一列中的特定值并从 pandas 的另一列中获取之前/之后的 n 行

Python:(带替换的采样):从集合中提取不同 N 元组集合的高效算法

python - 在 Django 中添加路径以创建更多 View

python - 使用 flags() 创建一个 QTableWidgetItem

python - 在多个文本文件中搜索两个字符串?

python - 如何使用 Xpath (lxml) 从多个标签中提取文本?

python - 将 fixture 传递给 PyTest 中的辅助函数?

python - 如何将这两条 3D 线与 Python 的 matplotlib 中的表面连接在一起