checksum - 如何解决 Zlib adler32 滚动校验和问题?

标签 checksum rsync zlib adler32

我正在使用 zlib 中的 adler32 函数来计算一块内存 x(长度为 4096)的弱校验和。一切都很好,但是如果来自不同文件的块不匹配,现在我想执行滚动校验和。但是,我不确定如何编写一个函数来对 zlib 中的 adler32 返回的值执行该操作。因此,如果校验和不匹配,如何使用原始校验和、x + 1 字节和 x + 4096 + 1 计算滚动校验和?基本上试图构建 rsync 实现。

最佳答案

Pysync 已经在 zlib 的 Adler32 之上实现了滚动,如下所示:

_BASE=65521      # largest prime smaller than 65536
_NMAX=5552       # largest n such that 255n(n+1)/2 + (n+1)(BASE-1) <= 2^32-1
_OFFS=1          # default initial s1 offset   
import zlib
class adler32:
    def __init__(self,data=''):
        value = zlib.adler32(data,_OFFS)
        self.s2, self.s1 = (value >> 16) & 0xffff, value & 0xffff
        self.count=len(data)
    def update(self,data):
        value = zlib.adler32(data, (self.s2<<16) | self.s1)
        self.s2, self.s1 = (value >> 16) & 0xffff, value & 0xffff
        self.count = self.count+len(data)
    def rotate(self,x1,xn):
        x1,xn=ord(x1),ord(xn)
        self.s1=(self.s1 - x1 + xn) % _BASE
        self.s2=(self.s2 - self.count*x1 + self.s1 - _OFFS) % _BASE
    def digest(self):
        return (self.s2<<16) | self.s1
    def copy(self):
        n=adler32()
        n.count,n.s1,n.s2=self.count,self.s1,self.s2
        return n

但正如 Peter 所说,rsync 不直接使用 Adler32,而是它的一个更快的变体。

rsync的代码工具有点难读,但结帐 librsync .这是一个完全独立的项目,并且更具可读性。看看rollsum.crollsum.h .在 C 宏中有一个变体的有效实现:
/* the Rollsum struct type*/
typedef struct _Rollsum {
    unsigned long count;               /* count of bytes included in sum */
    unsigned long s1;                  /* s1 part of sum */
    unsigned long s2;                  /* s2 part of sum */
} Rollsum;

#define ROLLSUM_CHAR_OFFSET 31

#define RollsumInit(sum) { \
    (sum)->count=(sum)->s1=(sum)->s2=0; \
}

#define RollsumRotate(sum,out,in) { \
    (sum)->s1 += (unsigned char)(in) - (unsigned char)(out); \
    (sum)->s2 += (sum)->s1 - (sum)->count*((unsigned char)(out)+ROLLSUM_CHAR_OFFSET); \
}

#define RollsumRollin(sum,c) { \
    (sum)->s1 += ((unsigned char)(c)+ROLLSUM_CHAR_OFFSET); \
    (sum)->s2 += (sum)->s1; \
    (sum)->count++; \
}

#define RollsumRollout(sum,c) { \
    (sum)->s1 -= ((unsigned char)(c)+ROLLSUM_CHAR_OFFSET); \
    (sum)->s2 -= (sum)->count*((unsigned char)(c)+ROLLSUM_CHAR_OFFSET); \
    (sum)->count--; \
}

#define RollsumDigest(sum) (((sum)->s2 << 16) | ((sum)->s1 & 0xffff))

关于checksum - 如何解决 Zlib adler32 滚动校验和问题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6178201/

相关文章:

algorithm - 为什么在 Adler-32 校验和算法中对 65521 取模?

objective-c - 识别文件中的更改

c++ - 如何在 Arduino/C++ 中计算校验和?

linux - 在后台运行 rsync

java - Android Deflator 内存不足错误

linux - 在 linux 中创建大型稀疏图像的校验和

c# - 是否有任何使用 rsync 的 .NET API?

hadoop - rsync 文件到 hadoop

c# - 在 Python 中压缩 在 C# 中解压

c++ - zlib 不同解压大小