python - 使用 zlib 以 C 语言读取 Python 压缩数据

我有一个 C 代码，可以为物理模拟写入多个数据文件。这些数据文件基本上是包含二维值映射的文本文件，范围从 -1 到 +1。它们可能很大(每个大约 100 Mb)，但由于许多值通常是相同的(+1 或 -1 的长字符串)，我认为压缩它们是个好主意。

写入该文件的 C 代码的相关部分如下:

FILE *fp1;
char file1[] = "output_file.dat";
fp1 = fopen(file1,"w");
for ( i = 0; i < Nx; i++ ) {
    for ( j = 0; j < Ny; j++ ) {
        fprintf(fp1, "%.5f ", creal(phi[i*Ny+j]));
    }
    fprintf(fp1, "\n");
}
fclose(fp1);

读取文件的 Python 代码的相关部分是:

import numpy as np
data = np.loadtxt("output_file.dat")

现在，我尝试使用 zlib 库添加压缩。我按以下方式更改了 C 代码:

# include <zlib.h>
gzFile fp1;
char file1[] = "output_file.dat";
fp1 = gzopen(file1,"w");
for ( i = 0; i < Nx; i++ ) {
    for ( j = 0; j < Ny; j++ ) {
        gzprintf(fp1, "%.5f ", creal(phi[i*Ny+j]));
    }
    gzprintf(fp1, "\n");
}
gzclose(fp1);

以及 Python 代码:

import numpy as np
import zlib
compressed_data = open("output_file.dat", 'rb').read() 
data = zlib.decompress(compressed_data)

C 代码似乎运行良好。正在写入数据文件，它们小于 2 Mb(考虑到内容的冗余，这是合理的)。不幸的是，Python 脚本给了我一个错误:

error: Error -3 while decompressing data: incorrect header check

任何人都可以指出我如何调试这个的正确方向吗？谢谢!

最佳答案

好吧，解决方案非常简单。基本上，如果我使用 .gz 扩展名编写数据文件:

# include <zlib.h>
gzFile fp1;
char file1[] = "output_file.gz";
fp1 = gzopen(file1,"w");
for ( i = 0; i < Nx; i++ ) {
    for ( j = 0; j < Ny; j++ ) {
        gzprintf(fp1, "%.5f ", creal(phi[i*Ny+j]));
    }
    gzprintf(fp1, "\n");
}
gzclose(fp1);

然后，我可以使用loadtext函数来读取它们，它们将被numpy自动解压:

import numpy as np
data = np.loadtxt("output_file.gz")

或者，我仍然可以使用 zlib.decompress 函数，但再传递一个参数(如 this 问题中所述):

zlib.decompress(compressed_data, 15 + 32)

关于python - 使用 zlib 以 C 语言读取 Python 压缩数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55595997/

python - 使用 zlib 以 C 语言读取 Python 压缩数据

上一篇：c - C 中的动态 3D 矩阵创建

下一篇：c - 调用函数时出现 'expected expression'错误如何解决？