hash - 是否有任何常见的操作系统文件系统使用哈希来避免多次存储相同的内容数据?

标签 hash operating-system filesystems

许多文件存储系统使用哈希来避免重复相同的文件内容数据(除其他原因外),例如,Git 和 Dropbox 都使用 SHA256。文件名和日期可以不同,但​​只要内容生成相同的哈希值,它就不会被存储多次。

为了节省空间,在操作系统文件系统中这样做似乎是明智之举。是否有任何适用于 Windows 或 *nix 的文件系统可以执行此操作,或者是否有充分的理由不执行此操作?

在大多数情况下,这将消除对重复文件查找器实用程序的需求,因为此时您将节省的唯一空间将用于文件系统中的文件条目,这对于大多数用户来说还不够重要。

编辑:可以说这可能会导致服务器故障,但我觉得开发人员更有可能了解所涉及的问题和权衡。

最佳答案

ZFS 从上个月开始支持重复数据删除:http://blogs.oracle.com/bonwick/en_US/entry/zfs_dedup

虽然我不会称其为“通用”文件系统(afaik,它目前仅受 *BSD 支持),但它绝对值得一看。

关于hash - 是否有任何常见的操作系统文件系统使用哈希来避免多次存储相同的内容数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1903416/

相关文章:

c++ - 创建哈希表来存储某个指针的值

hash - symstore是如何计算目录hash值的

php - 准确确定运行 PHP 的操作系统类型

c++ - 如何写入文件然后读回以验证其内容,确保您获得的是磁盘上的内容而不是缓存

c - c 语言中数据类型 BYTE、WORD 和 DWORD 的格式说明符?

linux - 使用 yocto 配方安装库

java - 比较作为映射的键和值的集合的大小

javascript - 将 2 个数字组合起来用作对象的键的有效方法是什么?

c - 什么时候返回 EINTR 错误?

linker - PC 与加载或链接地址有什么关系?