elasticsearch 获取实时数据的最佳方法(推文)

标签 elasticsearch

基本上,我的应用程序有两种类型的流量。

  • 实时推文注入(inject)(最多可延迟 1 分钟)
  • 来自多个用户的推文搜索

    我有 2 个问题
  • 将这些数据提取到 elasticsearch 的最佳方法是什么
  • 如果我一次将推文 1 写入实时弹性索引会发生什么?它会影响“并行搜索请求”吗?
  • 最佳答案

    索引和搜索是 Elasticsearch 中的两个主要操作,它们有自己的专用线程池来处理这些请求。

    来回答你的问题

    1.将这些数据摄取到elasticsearch的最佳方法是什么?

    您不应一一发送这些请求,而应使用 bulk API摄取数据,这对于此类用例是推荐的并且性能更高。批量操作的总大小在批量 API 中也很重要,而不是操作数。 Dzone博客对此很有用。

    2.如果我一次写一条推文到实时弹性索引会发生什么?它会影响“并行搜索请求”吗?

    如前所述,它们有自己的线程池,如果它们被消耗,您将在各自的操作中看到问题,但您可以通过多种方式调整索引和搜索操作。

    关于elasticsearch 获取实时数据的最佳方法(推文),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61789607/

    相关文章:

    regex - Logstash Grok过滤器Apache模式

    php - 查询elasticsearch地理距离邮政编码搜索

    elasticsearch - 除非在查询中明确声明,否则Elasticsearch不使用 “default_search”分析器

    php - Elastica在setScript之前未对聚合进行分组

    python - 多个字段的模糊性-仅在某些字段上使用模糊性

    elasticsearch - 从 ElasticSearch 中的两个不同字段创建一个 geo_point

    elasticsearch - Elasticsearch 中实时数据的最佳设置

    elasticsearch - Elasticsearch 索引互联网

    java - Elasticsearch - 在查询中将数组作为参数传递

    amazon-web-services - AWS 无服务器 Lambda 函数 : No module by name elasticsearch error