image - 存储图像以在 SOLR 搜索结果中显示

标签 image apache solr indexing jackrabbit

我已经构建了一个 SOLR 索引,其中包含我想要与搜索结果一起渲染图像的图像缩略图 URL。问题是这些图像可能会达到数百万个,我认为将图像作为二进制数据存储在索引中会使索引变得巨大。

我正在寻求有关如何在从 URL 渲染这些图像后有效存储这些图像的指导,我应该使用纯文件系统并由 tomcat 渲染它们,还是应该使用像 Apache Jackrabbit 这样的 JCR 存储库?

任何指导将不胜感激。

谢谢。

最佳答案

在最终决定如何保留图像之前,我会评估有效的要求。

您需要版本控制吗? 您打算仅搅拌图像或其他元数据吗? 您对水平缩放有什么要求吗? 您需要任何图像处理或缩放吗? 您需要访问图像元数据吗? 您需要额外的工具来管理图像吗? 您愿意投入时间学习额外的技术吗?

存储在文件系统上并通过图像 sppoler 实现使其可用是保存图像的最简单方法。 但是,如果您确定了上述的一些要求(对于内容存储库或水坝系统来说是典型的),那么最终将使用文件系统方法重新发明轮子。

另一个选项是使用一种内容存储库。 JCR 存储库(例如 Jackrabbit 或其商业实现 CRX)是一种选择。 Alfresco(支持 CMIS)将是另一个有效的。 上述两个存储库解决方案都支持版本控制、后处理(缩放...)、元数据提取和管理等功能。但这需要您学习新技术,这可能非常耗时。上述两种存储库技术都可能变得复杂。 如果需要水平扩展,我会考虑商业支持的存储库实现(CRX 或 Alfresco Enterprise),因为社区版本缺乏此功能。

就我个人而言,我真的会根据上述要求做出任何决定。 我与 Jackrabbit、CRX 以及 Alfresco CE 和 EE 进行了广泛的合作,就我个人而言,我会选择 Alfresco,因为我体验到它可以更好地扩展大量数据。

关于image - 存储图像以在 SOLR 搜索结果中显示,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16887095/

相关文章:

solr - 分布式 Solr 配置中的复制

java - 使用 "org.apache.solr.common.util.SimpleOrderedMap cannot be cast to java.util.Map"处理程序时出现 solrj "/suggest"异常

image - gitlab ci yml 图像和服务机制?

php - Hook 到 Wordpress 图片上传

php - 无法启动/重启 PHP 7.2 FPM 服务(CentOS 7、Apache)

php - 无法访问php中的环境变量

java - 我应该使用哪个 API 从图像中提取信息?

html - 使用 HTML/CSS 缩小图像大小是否会产生比 Fireworks 等更好的结果?

apache - 使用 git 存储库作为网站根文件夹

java - 将多个可搜索文件添加到一个 Solr-index-document