hadoop - 在生产系统中将solr数据存储在hdfs中好吗？

标签 hadoop solr

我在 hadoop 集群中使用 solr 4.x。爬取的数据存储在 hadoop 中并在 solr 中建立索引。当前 solr 配置为使用本地文件系统。我得去生产了。使用本地文件系统好还是 solr 应该使用 hdfs？使用 hdfs 有什么好处(如果我们必须使用)？将来我的索引大小可能会增加。

最佳答案

唯一的好处是复制和水平可扩展性。

关于hadoop - 在生产系统中将solr数据存储在hdfs中好吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36146260/

上一篇：Hadoop 可以列出 s3 内容，但 spark-shell 抛出 ClassNotFoundException

下一篇：hadoop - 在免费hadoop模式下运行官方示例时出现Spark异常

相关文章：

php - 将 MySQL 数据库完全导入到 Solr 4 会出现 404 错误

tomcat - DSE 3.0 Solr : Tomcat giving 404 errors

java - 如何在 spring-data-solr 中使用带有方法名称的 get 前缀？

scala - 如何以orc格式在已创建的配置单元表中加载excel数据

hadoop - HBase批量加载MapReduce HFile异常(netty jar)

sql - 如何在不单独指定每一列的情况下在所有行中搜索文本

node.js - Node solr 客户端 : Updating Document and Commiting

java - Solr 因 SocketException Broken pipe 而崩溃

hadoop - 无法在 hdfs 的目录下创建子目录

Cloudera 考试的 Hadoop 数据类型

©2024 IT工具网联系我们