python csv阅读器忽略空白行

标签 python csv python-3.x blank-line

我正在使用 pythons csv 阅读器。如何使用以下代码来忽略空行。

import csv
f1 = open ("ted.csv")
oldFile1 = csv.reader(f1, delimiter=',', quotechar='"')
oldList1 = list(oldFile1)
f2 = open ("ted2.csv")
newFile2 = csv.reader(f2, delimiter=',', quotechar='"')
newList2 = list(newFile2)

f1.close()
f2.close()

with open("ted.csv") as f1, open("ted2.csv") as f2, open('foo.csv', 'w') as out:
     r1, r2 = csv.reader(f1), csv.reader(f2)
     st = set((row[0], row[3]) for row in r1)
     wr = csv.writer(out)
     for row in (row for row in r2 if (row[0],row[3]) not in st):
           wr.writerow(row)

最佳答案

如果您的空白始终位于第一行,那么 Marius 的答案是最简单的。如果开头有 n 个空格或者您只是想跳过一些行,则可以使用 itertools.islice() .

跳过前 N 行

假设您想跳过前 4 行(无论是否为空行):

from itertools import islice
with open('csv2.csv', 'r') as f1, open('out.csv', 'w') as out:
    filt_f1 = islice(f1, 4, None)
    r1 = csv.reader(filt_f1)
    wr = csv.writer(out)
    for line in r1:
        ...

全文空白行

如果您的文件中散布着空白行,那么您可以使用 itertools.filterfalse 将其过滤掉。 .

import csv
from itertools import filterfalse
from itertools import chain

with open('csv1.csv', 'r') as f1, open('csv2.csv', 'r') as f2, open('out.csv', 'w') as out:
    # create an iterator without lines that start with '\n'
    filt_f1 = filterfalse(lambda line: line.startswith('\n'), f1)
    filt_f2 = filterfalse(lambda line: line.startswith('\n'), f2)

    # csv.reader consumes the filtered iterators
    r1, r2 = csv.reader(filt_f1), csv.reader(filt_f2)
    wr = csv.writer(out)

    # here insert your logic, I just write both to the same file
    for line in chain(r1, r2):
        wr.writerow(line)

csv1.csv 的位置:

time,name,location
12345,Jean,Montreal

12346,Peter,Chicago

1234589,Doug,Boston

和 csv2.csv(注意:此处未显示,但 csv2.csv 在文件顶部有 4 个空行):

123457,Scott,San Diego

123458,Jen,Miami

123459,Robert,Sacramento

输出 out.csv 整个过程中没有空行:

time,name,location
12345,Jean,Montreal
12346,Peter,Chicago
1234589,Doug,Boston
123457,Scott,San Diego
123458,Jen,Miami
123459,Robert,Sacramento

关于python csv阅读器忽略空白行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31508832/

相关文章:

python - 如何在 x86_64 主机上使用 Setup.py 构建 32 位 Python 模块分发

python - 如何使用python获取时间的秒数

python - 如何在 python 中创建悬挂指针(在堆栈或堆中)

python - 从 pandas df 中的列创建二元组

python - 如何在 Windows 子进程中通过 ssh 运行 git fetch

python - TCP 数据包编号如何使重传更容易?

mysql - 从 vbs 和 Access 中将 csv 文件导入 mysql 时遇到问题

linux - 在 Linux 中打印 CSV 文件中的一列

python - 用通过比较另一列的数据获得的数据填充一列

python 3.6.9锁屏