我需要创建一个唯一的散列但想维护 'uuid' structure,因此我正在考虑使用类似的东西:
uuid.uuid5(uuid.NAMESPACE_DNS, 'python.org')
而不是 sha1:
hashlib.sha1('python.org').hexdigest()
但是想知道,如果它们提供相同的冲突概率,或者 uuid5 可能因为命名空间而更容易发生冲突。
最佳答案
简单的答案:避免。
UUID5 将哈希值截断为 128 位。虽然 128 位对于大多数应用程序来说绝对没问题,但真正的问题是您在 SHA1 中使用的是过时且已弃用的哈希算法,并且您以后更难更改它。
简而言之:意外碰撞的可能性很小,但恶意制作的碰撞变得越来越可行。
如果可能,从 SHA2 或 SHA3 开始,并为您的哈希使用版本化对象,以便您将来可以更改算法。
关于python-2.7 - 当使用 uuid5 而不是 sha1 时,碰撞概率是否相同?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25310065/