我将 ElasticSearch 用于网站的搜索组件。被索引和最终搜索的数据与保存在 MySQL 数据库中的数据相同。
我的做法是在相应的CRUD MySQL操作发生时,在索引中增删改数据。
例如,创建操作看起来像这样:
public function savePost(Request $request) {
//Firstly, create the object and save it to MySQL
$post = new Post();
$post->title = $request->title;
$post->body = $request->body;
//...
//and so on
$post->save();
//Secondly, index this new data:
$elasticSearchClient = ClientBuilder::create()->build();
$params = [
'index' => 'some_index_elasticsearch',
'id' => $post->id,
'type' => 'post',
'timestamp' => time(),
'body' => [
'id' => $post->id,
'title' => $post->title,
'body' => $post->body,
//... and so on
],
];
$elasticSearchClient->index($params);
}
如果数据在 MySQL 中被删除/更新,我只需删除它或从索引中更新它。
这是将 MySQL 与 ElasticSearch(或任何其他类似技术,如 Sphinx)结合使用的正确方法吗?或者您会推荐一种更好的方法来使用 MySQL 作为 ElasticSearch 的更多数据源吗? (这里根本没有发生,因为 ElasticSearch 和 MySQL 之间根本没有交互)。
我正在使用 https://github.com/elastic/elasticsearch-php与 ElasticSearch 交互(如果有任何不同)。
澄清一下:到目前为止,这种方法确实有效 - 我只是不确定它是否是正确的方式,或者是否有人可以看到我在这种方式下可能遇到的问题东西。
最佳答案
没有使用 Elasticsearch 的“正确方法”。 “正确”是相对的,因此“正确的方式”是一种支持您的用例的方式。 Elasticsearch 不仅适用于一种特定的用例,而且适用于越来越多的不止一种用例。
您描述的情况是完全有效的,即在 ES 中索引您在另一个 RDBMS(例如 MySQL)中的任何内容,并确保索引的内容与主要的真实来源同步。
在您的用例中,您需要牢记的一件困难的事情是您必须保证 MySQL 和 ES 始终保持 1:1 同步,由于各种原因,这不一定容易做到:
- 如果您需要关闭 ES 进行维护,但您的应用出于任何原因必须保持运行,会发生什么情况?
- 如果 ES 中出现问题并且文档没有被索引/更新/删除,会发生什么情况? (记住没有交易支持)
还有其他不太脆弱的同步 MySQL 和 ES 的方法,例如by using the binlog .
您需要问自己这些问题并找出减轻这些潜在问题的策略,因为我可以向您保证它们(和其他问题)肯定会出现。
总而言之,您的架构没有问题,成千上万的公司都在做完全相同的事情,但是,如果您的同步计划失败,您需要有一个计划。
关于php - ElasticSearch 在 MySQL 中的使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40410920/