algorithm - 不考虑字符位置的字符串哈希函数

标签 algorithm hash hashtable

我的问题的标题是 self 描述的。 我需要散列三个 64 位变量的结构(我会将它们转换为一串字符),每个变量都包含一手纸牌 - 纸牌游戏应用程序,因此交换这些变量中的一些字符应该产生相同的散列。 一种方法是对结果字符串进行排序。有没有更好的解决方案?

最佳答案

如果一只手的表示类似于一个比特集,它就已经是无序的了。例如,如果您使用位掩码的组合来表示卡片的组合,比如说,像这样

A♠ - 0x00000001
2♠ - 0x00000002
3♠ - 0x00000004
4♠ - 0x00000008
...
K♠ - 0x00001000
A♥ - 0x00002000
2♥ - 0x00004000
...

然后您可以使用位组合来表示手,如下所示:

A♠ 4♠ 2♥ - 0x00004009

此表示与位置无关,即手 4♠ A♠ 2♥2♥ 4♠ A♠ 将具有与 A 完全相同的表示♠ 4♠ 2♥。您可以根据需要将此表示转换为字符串,方法是迭代各个位,并在每次发现设置为 1 的位时向字符串表示添加一张卡片。

通过对表示的高 32 位与低 32 位进行异或运算,可以使用这样的表示来计算 32 位哈希码:

uint64_t hand = ... // A representation of hand similar to what's described above
uint32_t hash = (uint32_t)(hand ^ (hand >> 32));

Currently my cards are presented as bytes, but bits in two cards can overlap: A♣ = 0x11; 10♣=0x12; K♣=0x13 ... and so on.

您可以在计算哈希码时将此表示转换为上述表示,并避免以这种方式排序:

// Each card is a number from 1 to 53, inclusive
uint8_t hand[HAND_SIZE] = ...; // The hand
uint64_t set = 0;
for (int i = 0 ; i != HAND_SIZE ; i++) {
    set |= (1LL << hand[i]);
}
uint32_t hash = (uint32_t)(set ^ (set >> 32));

关于algorithm - 不考虑字符位置的字符串哈希函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27971035/

相关文章:

c# - (高斯)滤波后归一化图像

Javascript 文本相似度算法

arrays - 将散列推送到数组的这段 Perl 代码有什么问题?

powershell - Powershell-哈希表转义引号

java - 如何在java中实现哈希表的构造函数

arrays - Powershell读取/更新/写入参数文件

java - 比较 Java 中公共(public)元素列表的更快方法?

algorithm - 确定哪一组边会导致负循环?

algorithm - 句子索引

c# - 存储经过良好散列处理的密码及其散列方法是否很危险?