python - 需要在Python中为语料库创建直方图

标签 python nltk dictionary

import nltk
from nltk.book import *
from nltk.corpus import brown
corpus_text = brown.words()
word_freq = FreqDist(corpus_text)
word_hist = dict()

for k,v in word_freq.iteritems():
   if key in word_hist:
      word_hist[v] = word_hist[v] + 1
   else:
      word_hist[v] = 1 

print word_hist.viewkeys()
print word_hist.viewvalues()

我在这里处理字典时犯了一个错误。需要创建一个字典,其中包含 它的键是 freqdict 中的单词,值是相应单词的数量。我该如何执行这个增量?

我确信

      word_hist[v] = word_hist[v] + 1
   else:
      word_hist[v] = 1

有一个错误。

最佳答案

当然。看来您正在用其值之一(加 1)替换 word_hist 字典。尝试一下

word_hist[v] = word_hist[v] + 1

甚至更好

word_hist[v] += 1

相反。

编辑:还有另一个错误:

for k,v in word_freq.iteritems():
   if key in word_hist:
      word_hist[v] = word_hist[v] + 1
   else:
      word_hist[v] = 1

没有任何意义。测试 key 是否存在于 word_hist 中,但随后使用 v

我不知道 key 是什么,但可以使用 kv 两者。

关于python - 需要在Python中为语料库创建直方图,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7594056/

相关文章:

python - 扫描由未知字符分隔的两个整数

nlp - 如何使用带有 nltk 的斯坦福 Open IE

python - 无法在朴素贝叶斯中训练模型

arrays - 在 Swift 中创建具有自变量的 "grid"项?

python - 如果字典中必须存在键,则使用 get 函数?

python - 解析参数和构建值

Python函数装饰器错误

python - 从 nltk word_tokenize 获取原始文本的索引

python - 在 2 列 Pandas 上映射

Python:打印出复杂数据结构的所有值(不包括哈希键)