所以我基本上有一个非常长的字符串列表,以及一个包含一列字符串和一列数字的 CSV 文件。我需要遍历极长的字符串列表,对于每个字符串,循环遍历 CSV 文件的行,检查 CSV 第一列中的每个字符串,看它是否出现在我的字符串中,如果出现,添加另一列中的数字。一个最小的例子是
import csv
sList = ['a cat', 'great wall', 'mediocre wall']
vals = []
with open('file.csv', 'r') as f:
r = csv.reader(f)
for w in sList:
val = 0
for row in r:
if row[0] in w:
val += 1
vals.append(val)
我可能会使用它的 CSV 文件示例可能是
a, 1
great, 2
当然,csv.reader(f) 创建了一个我只能循环一次的可迭代对象。我在其他地方看到过使用 itertools 的建议,但我发现的所有建议都是针对涉及循环 CSV 文件少量次数(通常只有两次)的问题。如果我多次尝试使用它来遍历 CSV,我不确定这对内存消耗意味着什么,一般来说,我只是想知道解决这个问题的最聪明的方法。
最佳答案
您需要“重置”文件迭代器:
import csv
sList = ['a cat', 'great wall', 'mediocre wall']
vals = []
with open('data.csv', 'r') as f:
r = csv.reader(f)
for w in sList:
val = 0
f.seek(0) #<-- set the iterator to beginning of the input file
for row in r:
print(row)
if row[0] in w:
val += 1
vals.append(val)
关于python - 只能通过 csv 阅读器迭代一次,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27350944/