我在 hadoop 集群中使用 solr 4.x。爬取的数据存储在 hadoop 中并在 solr 中建立索引。当前 solr 配置为使用本地文件系统。我得去生产了。使用本地文件系统好还是 solr 应该使用 hdfs?使用 hdfs 有什么好处(如果我们必须使用)? 将来我的索引大小可能会增加。
最佳答案
唯一的好处是复制和水平可扩展性。
关于hadoop - 在生产系统中将solr数据存储在hdfs中好吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36146260/