我正在从我的站点创建数据转储供其他人下载和分析。每个转储都是一个巨大的 XML 文件。
我正在尝试找出最好的压缩算法:
- 高效压缩(CPU 方面)
- 制作尽可能小的文件
- 相当普遍
我知道压缩的基础知识,但不知道哪种算法符合要求。我将使用 MySQL 和 Python 生成转储,因此我需要一些具有良好 Python 库的东西。
最佳答案
对于大多数情况,具有标准压缩级别的 GZIP 应该没问题。更高的压缩级别=更多的 CPU 时间。 BZ2 打包得更好,但也更慢。好吧,在 CPU 消耗/运行时间和压缩效率之间总是存在权衡……所有具有默认压缩级别的压缩都应该没问题。
关于python - 什么是数据转储的最佳压缩算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6067836/