我有重量约为 200GB 的文本文件。
我在数据库中存储了一对 key
- position_in_file
,
并使用 fseek
获取数据。
有没有推荐的压缩文件的方法,
并在压缩文件中寻找位置,
无需从文件开头解压。
[我更喜欢用C作为语言]
[无需执行写入。不需要超快]
最佳答案
这是一个 example of random access of deflated data .它遍历压缩数据一次以构建一个随机访问索引,入口点大约每 1 MB 未压缩数据。 (您可以更改该密度。)每个入口点都位于压缩 block 边界,并保存其前面的 32K 未压缩数据,以便填充滑动字典以进行解压缩。
关于c - 在压缩文件中查找,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31273945/