php - ElasticSearch 在 MySQL 中的使用

标签 php mysql elasticsearch

我将 ElasticSearch 用于网站的搜索组件。被索引和最终搜索的数据与保存在 MySQL 数据库中的数据相同。

我的做法是在相应的CRUD MySQL操作发生时,在索引中增删改数据。

例如,创建操作看起来像这样:

public function savePost(Request $request) {
    //Firstly, create the object and save it to MySQL
    $post = new Post();
    $post->title = $request->title;
    $post->body = $request->body;
    //...
    //and so on
    $post->save();

    //Secondly, index this new data:
    $elasticSearchClient = ClientBuilder::create()->build();

    $params = [
        'index' => 'some_index_elasticsearch',
        'id' =>  $post->id,
        'type' => 'post',
        'timestamp' => time(),
        'body' => [
            'id' => $post->id,
            'title' => $post->title,
            'body' => $post->body,
            //... and so on
        ],
    ];

    $elasticSearchClient->index($params);

}

如果数据在 MySQL 中被删除/更新,我只需删除它或从索引中更新它。

这是将 MySQL 与 ElasticSearch(或任何其他类似技术,如 Sphinx)结合使用的正确方法吗?或者您会推荐一种更好的方法来使用 MySQL 作为 ElasticSearch 的更多数据源吗? (这里根本没有发生,因为 ElasticSearch 和 MySQL 之间根本没有交互)。

我正在使用 https://github.com/elastic/elasticsearch-php与 ElasticSearch 交互(如果有任何不同)。

澄清一下:到目前为止,这种方法确实有效 - 我只是不确定它是否是正确的方式,或者是否有人可以看到我在这种方式下可能遇到的问题东西。

最佳答案

没有使用 Elasticsearch 的“正确方法”。 “正确”是相对的,因此“正确的方式”是一种支持您的用例的方式。 Elasticsearch 不仅适用于一种特定的用例,而且适用于越来越多的不止一种用例。

您描述的情况是完全有效的,即在 ES 中索引您在另一个 RDBMS(例如 MySQL)中的任何内容,并确保索引的内容与主要的真实来源同步。

在您的用例中,您需要牢记的一件困难的事情是您必须保证 MySQL 和 ES 始终保持 1:1 同步,由于各种原因,这不一定容易做到:

  • 如果您需要关闭 ES 进行维护,但您的应用出于任何原因必须保持运行,会发生什么情况?
  • 如果 ES 中出现问题并且文档没有被索引/更新/删除,会发生什么情况? (记住没有交易支持)

还有其他不太脆弱的同步 MySQL 和 ES 的方法,例如by using the binlog .

您需要问自己这些问题并找出减轻这些潜在问题的策略,因为我可以向您保证它们(和其他问题)肯定会出现。

总而言之,您的架构没有问题,成千上万的公司都在做完全相同的事情,但是,如果您的同步计划失败,您需要有一个计划。

关于php - ElasticSearch 在 MySQL 中的使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40410920/

相关文章:

php - 如何使用HTML表单正确地将日期时间插入MYSQL数据库?

php - 为什么我从 JS 和 PHP Mersenne Twister 实现中得到不同的值?

java - SQLException : Communications link failure (Java/mysql)

php - 如何将 php 数组从 mysql 返回到 google geolocation

php - 无法使用 PHP 进行 AJAX post 工作

php - 为 View 使用替代结构时出错

arrays - Elasticsearch中的排序数组类型

elasticsearch - 两个节点的集群的 discovery.zen.minimum_master_nodes 值

elasticsearch - 过滤数据时出现logstash grok问题

php - 在Elasticsearch中处理必须/应该