indexing - D 中的 SHA1 索引哈希表

标签 indexing hashtable d sha1

我正在使用由 SHA1-digests (ubyte[20]) 索引的 D 内置哈希表来关联文件系统搜索引擎中的信息。

是否有任何数据结构更适合于此(在 D 中),因为这样的键具有所有良好的属性:均匀、分布式、随机、固定大小,或者 D 的内置哈希表的行为会自动找出它例如,可以只选择 SHA1 摘要的前 n (1-8) 个字节作为存储桶索引吗?

最佳答案

我认为标准映射中使用的哈希函数足够简单(成本方面),除非您运行主要是查找的代码,否则它不会产生太大的差异。请记住,将读取完整 key 以进行最终比较,因此无论哪种方式它都会加载到缓存中。

OTOH 我认为有一个可以重载的 opHash 方法。

关于indexing - D 中的 SHA1 索引哈希表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20179287/

相关文章:

python - 基于元组的子集 Pandas 数据框

Python 索引冲突

arrays - 接受任意大小的静态数组的函数 (D)

d - 无法定义关联数组类型 : opEquals doesn't exist

elasticsearch - logstash/elasticsearch 无法解析日期字段尝试了日期格式 [dateOptionalTime] 和带有语言环境的时间戳编号

mysql - 使用 Left Join 和子查询优化 MySQL 查询

algorithm - 我对这个双重哈希是正确的吗?

c - 罗宾汉哈希在C

c++ - 在编译时创建大型 HashMap 的最佳方法(C++)?

d - 重载外部函数以在单独的模块中使用