我想获取一个二进制文件的一部分,从字节#480161397到#480170447(包含在内,总共9051字节)
我使用cut -b
,我预计 trunk1.gz 的大小为 9051 字节,但我得到了不同的结果。
$ wget https://commoncrawl.s3.amazonaws.com/crawl-data/CC-MAIN-2016-07/segments/1454701152097.59/warc/CC-MAIN-20160205193912-00264-ip-10-236-182-209.ec2.internal.warc.gz
$ cut -b480161397-480170447 CC-MAIN-20160205193912-00264-ip-10-236-182-209.ec2.internal.warc.gz >trunk1.gz
$ echo $((480170447-480161397+1))
9051
$ ls -l trunk1.gz
-rw-r--r-- 1 david staff 3400324 Sep 8 10:28 trunk1.gz
出了什么问题?
最佳答案
cut -bN-M
从输入的每一行复制范围N-M
个字节。
示例:
$ cut -b4-7 <<END
0123456789
abcdefghij
ABCDEFGHIJ
END
输出:
3456
defg
DEFG
考虑使用 dd
来实现您的目的。
关于linux - 使用 gnu-coreutils、bash 获取二进制文件的一部分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39386321/