此问题曾由 user907629 提出过,和 Maria Zverina回答了问题,但她没有从外部 csv 文件导入数据。
我的文件包含超过 800000 条记录,我想导入外部 csv 文件。对此frequency count应该做哪些改变代码?
最佳答案
您可以在不存储任何中间列表的情况下完成此操作:
import csv
from collections import Counter
from itertools import imap
from operator import itemgetter
with open('yourcsv') as f:
next(f) # skip the header
cn = Counter(imap(itemgetter(2), csv.reader(f)))
for t in cn.iteritems():
print("{} appears {} times".format(*t))
没有理由将数据存储在列表中,除非您计划使用列表,itemgetter
只会从每行中提取第三列值。您需要传递您想要计数的任何列,并将分隔符设置为分隔数据的任何内容。
关于python - 使用外部 csv 文件计算 Python 列中单词的频率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34463263/