这听起来像是一个意见问题,但实际上是一个技术问题:是否有维护简单数据集的标准流程?
我的意思是这样的:假设我所拥有的只是一些东西的列表(我们会说书籍)。主要存储引擎是MySQL。我看到 Solr 有一个数据导入处理程序。我知道我可以使用它在第一次运行时提取书籍记录 - 是否可以使用它进行持续迁移?如果是这样,它对于更新已被拉入 Solr 的书籍是否会像拉入新书籍记录一样有效?
否则,如果数据导入处理程序不是执行此操作的标准方法,那么还有哪些其他方法?想法?
非常感谢您的帮助!
最佳答案
如果您想从 Solr 中更新文档,我相信您需要使用 UpdateRequestHandler 而不是 DataImportHandler。我在工作中从来没有需要这样做,所以我对此了解不多。您可能会发现感兴趣的链接:Uploading Data With Index Handlers .
如果您想使用新添加到 MySQL 数据库的记录来更新 Solr,您可以使用 DataImportHandler 进行增量导入
。基本上,它的工作原理是 MySQL 中有某种字段显示新记录是新的。如果记录是新的,Solr 将导入它。例如,在我工作的地方,我们有一个“已更新”字段,Solr 使用该字段来确定是否应该导入该记录。这是一个很好的访问链接:DataImportHandler
关于mysql - Solr:从 MySQL 持续迁移,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30670654/