python - 使用 python 从 .gz 文件中删除特定行(模式)以处理大文件

标签 python gzip

我正在使用 .gz 扩展名文件,其中需要我以最少的处理时间从文件中删除特定模式,并且根本不更改文件。

最佳答案

您是否尝试过使用 gzip.GzipFile ?参数类似于open

如果某个条件不匹配,则从文件中读取行并写入另一个文件的示例:

import gzip

with gzip.GzipFile('output.gz', 'w') as fout:
    with gzip.GzipFile('input.gz','r') as fin:
        for line in fin:
            if not your_remove_condition(line):
                fout.write(line)

请注意,输入和输出文件必须不同。

关于python - 使用 python 从 .gz 文件中删除特定行(模式)以处理大文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30867919/

相关文章:

python - 如何使用 Python 解析 WIkidata JSON (.bz2) 文件?

ruby-on-rails - 如何在 puma 服务器中启用 gzip

javascript - 在 Nodejs 中解析 gzip 流

Python gzip 模块在 ubyte 文件上无法按预期工作

wcf - 如何在编码器级别确定 WCF 消息大小

python - 将 Pandas 数据集转换为数组,以便在 Scikit-Learn 中建模

python - PyEphem 角度说明

python - 从 ROBOT 框架中的 python 模块调用特定方法

gzip - 使用 RestSharp 发布 GZip 内容

Python 杆切割算法 - 变体