sorting - ElasticSearch 深度嵌套排序/评分

标签 sorting elasticsearch

我的索引中有以下类型的文档,但由于深度嵌套方面,找不到正确排序的方法。

文档示例:

{
  "metadatas": [{
    "name": "name",
    "timeValidity": [{
      "since": "1970-01-01T00:00:00.000Z",
      "until": "2100-01-01T00:00:00.000Z",
      "value_s": "Some random name"
    }]
  }, {
    "name": "riskRatio",
    "variants": [{
      "value": "3Y",
      "timeValidity": [{
        "since": "2017-11-17T23:59:59.999Z",
        "until": "2017-12-01T23:59:59.998Z",
        "value_f": 0.6931
      }, {
        "since": "2017-12-01T23:59:59.999Z",
        "until": "2018-03-01T23:59:59.999Z",
        "value_f": 0.7215
      }, {
        "since": "2018-04-12T00:00:00.000Z",
        "until": "2018-04-16T23:59:59.999Z",
        "value_f": 0.6849
      }]
    }]
  }]
}

我希望在匹配时进行排序或提升,以便获得按 metadatas.variants.timeValidity.value_f 排序的文档(asc/desc) 具有 metadata.name=riskRatio 的约束并且在该嵌套文档中 metadata.variants.value=3Y并且在该嵌套文档中 metadata.variants.timeValidity.since <= SOME_DATEmetadata.variants.timeValidity.until >= SOME_DATE
过滤结果很好。我的问题在于事物的排序方面。
script_score似乎需要指定一个不可能的访问 key ,因为我不知道数组中的位置。 sort不允许我过滤两个属性的范围,因此它也是一个死胡同。所以我最后一次失败的尝试是像这样从下到上:
{
  "sort": [{
    "metadatas.variants.timeValidity.value_f": {
      "mode": "min",
      "order": "asc",
      "nested": {
        "path": "metadatas.variants.timeValidity",
        "filter": {
          "range": {
            "metadatas.variants.timeValidity.since": {
              "lte": "2018-01-21T23:59:59.999Z"
            },
            "metadatas.variants.timeValidity.until": { // forbidden !!
              "gte": "2018-01-21T23:59:59.999Z"
            }
          }
        },
        "nested": {
          "path": "metadatas.variants",
          "filter": {
            "match": {
              "metadatas.variants.value": "3Y"
            }
          },
          "nested": {
            "path": "metadatas",
            "filter": {
              "match": {
                "metadatas.name": "riskRatio"
              }
            }
          }
        }
      }
    }
  }]
}

我怎样才能正确排序?通过提升排序也可以,但对我来说是一个死胡同。

最佳答案

添加 explain:true对查询非常有帮助,有助于调试和了解正在发生的事情。

这会给你一个额外的sort通过点击显示它所花费的值。

为了能够查询两个范围,必须使用 BooleanQueryfilter排序的部分。最终正确的查询如下:

{
  "sort": [{
    "metadatas.variants.timeValidity.value_f": {
      "mode": "min",
      "order": "asc",
      "nested": {
        "path": "metadatas",
        "filter": {
          "match": {
            "metadatas.name": "riskRatio"
          }
        },
        "nested": {
          "path": "metadatas.variants",
          "filter": {
            "match": {
              "metadatas.variants.value": "3Y"
            }
          },
          "nested": {
            "path": "metadatas.variants.timeValidity",
            "filter": {
              "bool": {
                "must": [{
                  "range": {
                    "metadatas.variants.timeValidity.since": {
                      "lte": "2018-01-21T23:59:59.999Z"
                    }
                  }
                }, {
                  "range": {
                    "metadatas.variants.timeValidity.until": {
                      "gte": "2018-01-21T23:59:59.999Z"
                    }
                  }
                }]
              }
            }
          }
        }
      }
    }
  }]
}

关于sorting - ElasticSearch 深度嵌套排序/评分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50963619/

相关文章:

javascript - Angularjs orderBy(使用带有反向和多个字段的默认顺序)

Grails-ElasticSearch 插件 : Conditional Indexing of domain instances

java.lang.IllegalStateException : Failed to introspect Class 错误

elasticsearch - 同时使用 Varnish 和 elasticsearch 是一个糟糕的架构选择吗?

c++ - 在排序的 STL 容器中查找给定键的 "best matching key"

c++ - 仅使用iostream按字母顺序对二维数组进行冒泡排序?

python - 排序大文本数据

elasticsearch - 多领域术语聚合方法

elasticsearch - ElasticSearch随机分数与提升相结合?

c++ - 将过滤器应用于 Ldap 搜索也会对结果进行排序