solr - 有没有办法将 Solr 配置为在 Amazon S3 上运行,索引文件位于 S3 而不是本地存储上?

标签 solr amazon-s3

我想知道是否有一种方法可以配置 Apache Solr 以索引存储在 S3 上的文件,并将索引文件也保留在 S3 上。我想要一个负载平衡(LD)方案,其中多个处理器可以共享主索引。这将允许我使用 Solr 启动其他 EC2 实例并将它们指向一个公共(public)存储库和索引。

我正在使用 PHP,非常感谢任何想法或建议。

谢谢。

最佳答案

有一个名为 lucene-s3directory 的新项目。它使 Lucene 能够直接向/从 AWS S3 读取和写入索引,并且不需要本地文件系统。我很确定它可以很容易地适应 Solr。现在还处于早期阶段,因此请谨慎使用。

S3Directory dir = new S3Directory("my-lucene-index");
dir.create();
// use it in your code in place of FSDirectory, for example
dir.close();
dir.delete();

关于solr - 有没有办法将 Solr 配置为在 Amazon S3 上运行,索引文件位于 S3 而不是本地存储上?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9186137/

相关文章:

java - 如何在Apache SOLR Cloud模式下加载原生库(.so)?

java - 有没有办法列出请求者付款标记的 Amazon S3 存储桶中的对象?

amazon-web-services - 用于浏览器轮询的 Amazon SQS?

ios - AWS SDK S3 上传凭证

javascript - 自动上传图片到s3

java - apache solr 使用了多少额外空间/RAM/CPU?

solr - 如果WildcardQuery不影响文档的评分,为什么它会不断返回0.5?

solr - 避免系统文件夹的 Sitecore Lucene/Solr 索引

solr - 修改solr主机和端口以进行Spring Boot执行器健康检查

django - 如何使用 django-storages 和 boto3 获取 aws s3 对象键