为了能够检测特定推文的转发量,我计划将每个格式化推文的哈希值存储在数据库中。
我应该使用什么哈希算法。神秘当然不是必需的。只是一种将数据存储为某种东西的最小方式,如果它们相同,则可以以一种有效的方式进行比较。
我的第一次尝试是使用 md5 哈希。但我认为可以有更高效的哈希算法,因为不需要安全性。
最佳答案
你真的需要散列吗? Twitter 消息足够短(而且磁盘空间足够便宜),因此最好只存储整个消息,而不是耗尽时钟周期来散列它。
关于python - 使用计算成本低廉的 Python 哈希算法检测转推,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/815313/