hadoop - 在生产系统中将solr数据存储在hdfs中好吗?

标签 hadoop solr

我在 hadoop 集群中使用 solr 4.x。爬取的数据存储在 hadoop 中并在 solr 中建立索引。当前 solr 配置为使用本地文件系统。我得去生产了。使用本地文件系统好还是 solr 应该使用 hdfs?使用 hdfs 有什么好处(如果我们必须使用)? 将来我的索引大小可能会增加。

最佳答案

唯一的好处是复制和水平可扩展性。

关于hadoop - 在生产系统中将solr数据存储在hdfs中好吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36146260/

相关文章:

php - 将 MySQL 数据库完全导入到 Solr 4 会出现 404 错误

tomcat - DSE 3.0 Solr : Tomcat giving 404 errors

java - 如何在 spring-data-solr 中使用带有方法名称的 get 前缀?

scala - 如何以orc格式在已创建的配置单元表中加载excel数据

hadoop - HBase批量加载MapReduce HFile异常(netty jar)

sql - 如何在不单独指定每一列的情况下在所有行中搜索文本

node.js - Node solr 客户端 : Updating Document and Commiting

java - Solr 因 SocketException Broken pipe 而崩溃

hadoop - 无法在 hdfs 的目录下创建子目录

Cloudera 考试的 Hadoop 数据类型