python - 需要在Python中为语料库创建直方图

标签 python nltk dictionary

import nltk
from nltk.book import *
from nltk.corpus import brown
corpus_text = brown.words()
word_freq = FreqDist(corpus_text)
word_hist = dict()

for k,v in word_freq.iteritems():
   if key in word_hist:
      word_hist[v] = word_hist[v] + 1
   else:
      word_hist[v] = 1 

print word_hist.viewkeys()
print word_hist.viewvalues()

我在这里处理字典时犯了一个错误。需要创建一个字典，其中包含它的键是 freqdict 中的单词，值是相应单词的数量。我该如何执行这个增量？

我确信

      word_hist[v] = word_hist[v] + 1
   else:
      word_hist[v] = 1

有一个错误。

最佳答案

当然。看来您正在用其值之一(加 1)替换 word_hist 字典。尝试一下

word_hist[v] = word_hist[v] + 1

甚至更好

word_hist[v] += 1

相反。

编辑:还有另一个错误:

for k,v in word_freq.iteritems():
   if key in word_hist:
      word_hist[v] = word_hist[v] + 1
   else:
      word_hist[v] = 1

没有任何意义。测试 key 是否存在于 word_hist 中，但随后使用 v。

我不知道 key 是什么，但可以使用 k 或 v 两者。

关于python - 需要在Python中为语料库创建直方图，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7594056/

上一篇：python - 启用 AUTHENTICATION_BACKENDS 后 Django.contrib.auth 单元测试失败

下一篇：python - 如何返回网站并自动重定向到加载时间较长的另一端

相关文章：

python - 扫描由未知字符分隔的两个整数

nlp - 如何使用带有 nltk 的斯坦福 Open IE

python - 无法在朴素贝叶斯中训练模型

arrays - 在 Swift 中创建具有自变量的 "grid"项？

python - 如果字典中必须存在键，则使用 get 函数？

python - 解析参数和构建值

Python函数装饰器错误

python - 从 nltk word_tokenize 获取原始文本的索引

python - 在 2 列 Pandas 上映射

Python:打印出复杂数据结构的所有值(不包括哈希键)