python - 使用数组作为搜索输入的Elasticsearch查询

标签 python elasticsearch

我正在尝试使用字符串数组作为搜索输入来查询一些索引数据。

索引数据如下所示:

{
  "pubMedID": "21528671",
  "title": "Basic fibroblast [...] melanoma cells.",
  "abstract": "Human malignant [...] cell growth."
}

我想在“标题”和“抽象”字段中搜索多个字符串。例如:
queryString=['melanoma', 'dysplastic nevus syndrome']

我已经尝试使用以下代码:
queryString=['melanoma', 'dysplastic nevus syndrome']

payload={
  "query": {
    "bool": {
      "should": [
        {
          "query_string": {
            "query": queryString,
            "fields": [
              "title",
              "abstract"
            ]
          }
        }
      ]
    }
  }
}


payload_json = (json.dumps(payload))
res = esclient.search(index='medicine',body=payload_json)

但是运行此程序时出现以下错误:
RequestError: RequestError(400, 'parsing_exception', '[query_string] query does not support [query]')

如果我只输入一个简单的字符串值,该查询就可以正常工作。有人可以告诉我在输入数组时我应该如何进行这种查询吗?先感谢您!

最佳答案

编辑:

我对query_string查询有点不熟悉,但是事实证明,您也可以使用它执行以下操作:

qs = ''
for q in queryStrings:
  if qs:
    qs += ' OR '
  qs += q

payload={
  "query": {
    "bool": {
      "should": [
        {
          "query_string": {
            "query": qs,
            "fields": [
              "title",
              "abstract"
            ]
          }
        }
      ]
    }
  }
}

结果将是类似于下面概述的多重子句的查询。

docs在这里:https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-query-string-query.html

原版的:

这可以通过多个子句来实现,如下所示:
queryString=['melanoma', 'dysplastic nevus syndrome']

payload={
  "query": {
    "bool": {
      "should": [
        {
          "query_string": {
            "query": queryString[0],
            "fields": [
              "title",
              "abstract"
            ]
          }
        },
        {
          "query_string": {
            "query": queryString[1],
            "fields": [
              "title",
              "abstract"
            ]
          }
        }
      ]
    }
  }
}

如果查询数量可变,则只需要动态构建“应该”子句,例如:
shoulds = []
for q in queryStrings:
   shoulds.append({
      "query_string": {
        "query": q,
        "fields": [
          "title",
          "abstract"
        ]
      }
    })

payload={
  "query": {
    "bool": {
      "should": shoulds
    }
  }
}

关于python - 使用数组作为搜索输入的Elasticsearch查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55315215/

相关文章:

elasticsearch - 使用环境变量设置elasticsearch的集群名称

.net - ElasticSearch 高可用性设置

Python 多处理 : knowing the thread/CPU number

python - 直接比较两张图像,当一张有 alpha channel 时?

c# - 使用 Log4Net 时将整数值存储到 ElasticSearch

node.js - 如何使用node.js lib更新Elasticsearch中的项目?

elasticsearch - Logstash启动,但不会将数据加载到elasticsearch

python - 在python中加载json的一部分

python - 如何发送带附件的电子邮件?

python - OpenCV VideoWriter ffmpeg 一次又一次