例如,有 5 个对象存储。我正在考虑将文档插入其中,但不是按顺序插入。最初它可能是顺序的,但如果我可以使用某种排名方法插入,那么就更容易知道要搜索哪个对象存储来查找文档。目标是减少对象存储搜索的次数。这只有在插入使用某种智能算法时才能实现。
我发现一种有用的方法是使用当前年份的 MOD N(对象存储的数量)来确定文档的去向。我们能否对此有一些更好的方法?
最佳答案
如果您想要快速访问,有几个标准:
哈希函数必须可根据查询的数据进行重现。这意味着,很大程度上取决于您期望的查询。
您通常希望在商店中尽可能均匀地分配您的对象。如果你想并行,你想访问来自不同商店的给定查询的每个文档,这样它们就不会互相阻塞。因此,您的散列函数应尽可能分散到类似文档的不同商店。如果您希望与同一查询相关的文档来自同一年,请不要直接使用年份。
假设您希望能够进行可并行化的快速查询。相反,如果您有一个系统,在该系统中您首先必须打开一个可能代价高昂的存储连接,那么与同一查询相关的大多数文档都应该放在同一存储中,您不应该采纳我上面的建议。
关于algorithm - 减少 filenet 对象存储之间的搜索次数以根据文档创建时间查找文档的最佳方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9952554/