在决定是创建多个架构还是为不同文档类型创建单个统一架构时,一般的经验法则是什么。
例如,如果我想索引一组产品和一组文章,应该遵循什么一般规则来确定它们是否应该在一个模式中创建(然后使用 solr fq 过滤器查询对文档进行过滤类型)或在两个模式中创建。重叠字段的数量?需要跨两种文档类型返回数据并且还能够过滤到单一类型吗?
最佳答案
可能没有任何经验法则,更多的是偏好。
如果您有实体
- 您希望在回复中一起显示的内容或
- 他们之间有关系
最好将它们作为单个索引。
您可以拥有不同的实体,并希望在查询时加入它们,这将有助于处于单个核心中。 (尽管随着最新的发展,我认为跨内核也是可能的)
如果您的实体彼此完全无关,最好将它们作为单独的核心,以便以不同的方式维护它们。
多个核心可以让您更灵活地配置核心级别的安全性、每个核心的可变增量索引和分发......
多个核心可能会使用更多资源,具体取决于术语复制、缓存等
关于solr - solr 中针对不同文档类型的单个模式与多个模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13264580/