我想使用elasticsearch在文档列中搜索子字符串。文档列包含的字符串长度恰好为255个字符。在该列中,我想搜索指定位置内子字符串的出现。例如我想搜索位于字符串的字符位置5-7的子字符串“ABC”。因此,xxxxABCxxxxx ...是有效答案,但xxABCxxxxx ...不是(考虑索引从1开始)。
通配符查询可以搜索子字符串,但不能搜索指定的固定位置。
{
"query": {
"wildcard": {
"String Name": {
"value": "*ABC*"
}
}
}
}
如何在python中制定此查询?
最佳答案
您可以使用 regexp
过滤器来实现吗?
from elasticsearch import Elasticsearch
es = Elasticsearch(...)
resp = es.search(
index="index-name",
body={
"query": {
"regexp": {
"String Name": {
"value": "^.{4}ABC"
}
}
}
}
)
print(resp)
您必须启用 search.allow_expensive_queries
才能启用regexp
过滤器。<披露:我是Python Elasticsearch客户端的维护者,并由Elastic雇用>
关于python - Elasticsearch子字符串查询的一种特殊情况,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62507506/