elasticsearch - 标准分词器在哪些字符上定界?

标签 elasticsearch tokenize delimiter

我想知道哪些字符用于分隔 elasticsearch 标准分词器的字符串?

最佳答案

根据 documentation我相信这是用于定义标记的符号/字符列表:http://unicode.org/reports/tr29/#Default_Word_Boundaries

关于elasticsearch - 标准分词器在哪些字符上定界?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32742237/

相关文章:

c# - ElasticSearch 查询仅当所有字段都匹配我的过滤器时才检索结果?

c - 二叉树的标记化问题

solr - 不能在 Solr 中使用 ICUTokenizerFactory

java - java如何分离字符串中的特定元素

elasticsearch - 无法在Hive外部表中查询日期字段

elasticsearch - 不同类型的Elasticsearch 7.6 “illegal_argument_exception”映射器[processes.pid],current_type [text],merged_type [long]

elasticsearch - FluentBit 和 ES 的重复和缺失日志条目

c - C 中的标记化字符串文字数组

java - java中的分隔符

delimiter - db 中 "endDelimiter:@"的用途是什么(在我的例子中是 liquibase)