通常,散列的目标是将连续函数变成离散函数:输入的微小变化应该导致输出的巨大变化。但是,是否有任何散列算法(非常)粗略地说,为类似的输入返回相似但(仍然不同)的散列?
(使用此方法的一个示例是通过检查它们的散列的相似性来检查两个文件是否“相似”。当然,某些失败总是可以接受的。)
最佳答案
看 Locality Sensitive Hashing (LSH)。例如,这是一种快速找到给定点附近的一堆点的概率方法。
关于哈希相似度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4834301/