我正在考虑一个日常脚本来执行以下操作,以便解决 ES 服务器上的更新出现问题的任何情况(我还没有高可用性设置,即便如此,它也是如此)在 DB 和 ES 之间复制数据的情况下仍然可能是一个很好的做法)。在将这个脚本放在一起之前,我想我应该检查一下我是否以正确的方式进行此操作,以及是否有任何我应该使用的库或技术。
该脚本将简单地从数据库中检索所有 ID 以及从 ElasticSearch 中检索所有 ID,其中 created_at < current_time
(当前时间的快照,因为它是脚本运行时移动的目标)。然后它会根据这些 ID 集之间的差异向 Elastic search 添加和删除。
这听起来是一个合理的方法吗?
最佳答案
回答我的问题,这不是最好的方法。
一种更简单但更耗费资源的方法是定期重建整个索引。当然,这在生产中很难做到,因为这会导致几分钟或几小时的停机时间,因此技巧是重建一个新索引并改用它。在 ElasticSearch 中,您无法重命名索引,但可以使用别名。
关于ruby-on-rails - 确保 ElasticSearch 与数据库同步,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11952558/