Python 按字长计算字数

标签 python matplotlib

我得到了一个带有文本的 .txt 文件。我已经清理了文本(删除了标点符号、大写字母、符号),现在我有了一个包含单词的字符串。 我现在正在尝试获取字符串中每个项目的字符数 len() 。然后绘制一个图,其中 N 个字符在 X 轴上,Y 轴是具有这样的 N len() 个字符的单词数

到目前为止我有:

text = "sample.txt"

def count_chars(txt):
    result = 0
    for char in txt:
        result += 1     # same as result = result + 1
    return result

print(count_chars(text))

到目前为止,这是在查找文本的总 len() 而不是按单词查找。

我想得到类似函数 Counter Counter() 的东西,它返回单词及其在整个文本中重复的次数。

from collections import Counter
word_count=Counter(text)

我想获取每个单词的字符数。一旦我们有了这样的计数,绘图就会更容易。

谢谢,任何帮助!

最佳答案

好的,首先你需要打开sample.txt文件。

with open('sample.txt', 'r') as text_file:
    text = text_file.read()

text = open('sample.txt', 'r').read()

现在我们可以计算文本中的单词并将其放入例如字典中。

counter_dict = {}
for word in text.split(" "):
    counter_dict[word] = len(word)
print(counter_dict)

关于Python 按字长计算字数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67087535/

相关文章:

python - 如何关闭测试图matplotlib

python - 使用 matplotlib 绘制向日葵散点图

python - 如何使用 Matplotlib 避免 3D 绘图中的失真

python - 我如何在 OpenCascade 中获取实际的地形数据?

python - 使用 Scapy 模块 (python) 从 pcap 文件获取特定包

python - 在 Mac 上的 PyCharm 中显示工具栏时出现问题

python - 如何使条形图居中以显示某一列的差异?

python - 快速和 pythonic 的方法来找出一个字谜是否是回文?

python - Toree 安装问题

python - 在一张图中绘制多条线,x 轴为时间(以月为单位),y 轴为出现次数