有人能告诉我在哪里可以找到 TTTD(双阈值二除数)基于内容的分块算法的实现吗?基本上我想知道这里使用的哈希函数?我无法在 Internet 上找到任何有用的链接。
最佳答案
TTTD chunking algorithm ,就像它所基于的基本滑动窗口分块算法一样,需要计算文件上每个 n 字节窗口的哈希值。
因此,为了获得最佳性能,最好选择一个散列函数,以便在窗口向前移动一个字节时有效地更新散列值。例如,如果窗口大小是 8 个字节,窗口的当前内容是 foobarba
,下一个字节是 z
,我们希望能够高效地计算 H (oobarbaz
) 基于 H(foobarba
)。
有几个rolling hash functions可用于此目的,但显然,如上面链接的 TTTD 论文中所述,通常的方法是 Rabin fingerprinting ,它基于有限域算法。我链接的维基百科页面提供了算法的简要概述,并包含指向其他 Material 的链接。
关于algorithm - TTTD分块算法中使用的哈希函数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23994580/