linux - 使用 xz 而不是 gz - 非常慢

标签 linux zip gzip xz

如何将这些 gzip 方法更改为 xz?

这似乎可行,但运行起来真的非常慢......(~20-30 倍)

// gzip
... | gzip -c -1 > /path

// xz
... | xz -zf > /path

还没有测试过,但这是用 xz 压缩的方法吗?

// gzip
tar -zcf /path /path

// xz
tar -Jcf /path /path

最佳答案

我遇到了同样的问题,并对大型 (~2GB) 纯文本日志文件进行了一些测试。

事实证明,xz -0,即使用级别 0 进行压缩,更快 并且生成的文件小得多

time gzip -vc -9 test.log.1 > logs/test.log.gz9
real    2m34.079s
user    1m54.365s
sys     0m4.385s


time xz -vc -0 test.log.1 > logs/test.log.xz0
  100 %      53.1 MiB / 1,273.3 MiB = 0.042    11 MiB/s       1:53
real    1m53.779s
user    1m25.295s
sys     0m4.270s

time xz -vc -6 test.log.1 > logs/test.log.xz6
test.log.1 (1/1)
  100 %      53.9 MiB / 1,273.3 MiB = 0.042   798 KiB/s      27:13
real    27m13.968s
user    26m57.925s
sys     0m5.800s

-rw-r--r--  1 root   root    95M Sep  9 15:30 test.log.gz9
-rw-r--r--  1 root   root    54M Sep  9 15:38 test.log.xz0
-rw-r--r--  1 root   root    54M Sep  9 16:11 test.log.xz6

这些测试是在装有 Ubuntu 14.4 的 arm 迷你电脑上运行的

请注意,xz -0xz -6(默认值)之间生成的文件大小几乎没有差异。

我什至会投票让 xz -0 成为默认...


在普通机器上,xz -0 有点慢 并且生成的文件小得多(输入文件有 4.2GB) :

time tar -I 'xz -0' -cvf out.txz test.log
real    1m46.718s
user    1m42.000s
sys     0m23.084s

time tar -zcvf out.tgz test.log
real    1m13.778s
user    1m9.800s
sys     0m11.544s

-rw-rw-r--  1 root root 231M Sep 13 09:23 out.tgz
-rw-rw-r--  1 root root 125M Sep 13 09:37 out.txz
-rw-rw-r--  1 root root 4.2G Sep 13 09:07 test.log

来自 this answer :

tar -I 'xz -0' -cvf out.txz test.log

可能会加快您的归档速度,但肯定会给您带来更小的文件。

关于linux - 使用 xz 而不是 gz - 非常慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34464534/

相关文章:

scala - 使用 Gzip Play Framework 不起作用

bash - 使用 curl 时如何正确处理压缩页面?

linux - 这样的SSH key 对足以登录SSH吗?

linux - 在 bash 中读取文件的前三行

java - 安卓 ZipInputStream : only DEFLATED entries can have EXT descriptor

iis - IIS 中的 GZIP CSS 和 Javascript 文件

c++ - C++ 和 $! 之间的 PID 一致性bash 中的变量

linux - 在 :0 instead of :1 上启动 vncserver

java - ZIP文件的AES加密不正确的第2个16字节 block

c++ - Libzip - 从 zip 读取文件内容