我已经构建了一个 SOLR 索引,其中包含我想要与搜索结果一起渲染图像的图像缩略图 URL。问题是这些图像可能会达到数百万个,我认为将图像作为二进制数据存储在索引中会使索引变得巨大。
我正在寻求有关如何在从 URL 渲染这些图像后有效存储这些图像的指导,我应该使用纯文件系统并由 tomcat 渲染它们,还是应该使用像 Apache Jackrabbit 这样的 JCR 存储库?
任何指导将不胜感激。
谢谢。
最佳答案
在最终决定如何保留图像之前,我会评估有效的要求。
您需要版本控制吗? 您打算仅搅拌图像或其他元数据吗? 您对水平缩放有什么要求吗? 您需要任何图像处理或缩放吗? 您需要访问图像元数据吗? 您需要额外的工具来管理图像吗? 您愿意投入时间学习额外的技术吗?
存储在文件系统上并通过图像 sppoler 实现使其可用是保存图像的最简单方法。 但是,如果您确定了上述的一些要求(对于内容存储库或水坝系统来说是典型的),那么最终将使用文件系统方法重新发明轮子。
另一个选项是使用一种内容存储库。 JCR 存储库(例如 Jackrabbit 或其商业实现 CRX)是一种选择。 Alfresco(支持 CMIS)将是另一个有效的。 上述两个存储库解决方案都支持版本控制、后处理(缩放...)、元数据提取和管理等功能。但这需要您学习新技术,这可能非常耗时。上述两种存储库技术都可能变得复杂。 如果需要水平扩展,我会考虑商业支持的存储库实现(CRX 或 Alfresco Enterprise),因为社区版本缺乏此功能。
就我个人而言,我真的会根据上述要求做出任何决定。 我与 Jackrabbit、CRX 以及 Alfresco CE 和 EE 进行了广泛的合作,就我个人而言,我会选择 Alfresco,因为我体验到它可以更好地扩展大量数据。
关于image - 存储图像以在 SOLR 搜索结果中显示,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16887095/