elasticsearch - 标准分词器在哪些字符上定界？

标签 elasticsearch tokenize delimiter

我想知道哪些字符用于分隔 elasticsearch 标准分词器的字符串？

最佳答案

根据 documentation我相信这是用于定义标记的符号/字符列表:http://unicode.org/reports/tr29/#Default_Word_Boundaries

关于elasticsearch - 标准分词器在哪些字符上定界？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32742237/

上一篇：Elasticsearch - 映射冲突错误从 1.5 升级到 2.0

下一篇：arrays - 使用 elasticsearch 匹配嵌套数组中的所有值

相关文章：

c# - ElasticSearch 查询仅当所有字段都匹配我的过滤器时才检索结果？

c - 二叉树的标记化问题

solr - 不能在 Solr 中使用 ICUTokenizerFactory

java - java如何分离字符串中的特定元素

elasticsearch - 无法在Hive外部表中查询日期字段

elasticsearch - 不同类型的Elasticsearch 7.6 “illegal_argument_exception”映射器[processes.pid]，current_type [text]，merged_type [long]

elasticsearch - FluentBit 和 ES 的重复和缺失日志条目

c - C 中的标记化字符串文字数组

java - java中的分隔符

delimiter - db 中 "endDelimiter:@"的用途是什么(在我的例子中是 liquibase)

©2024 IT工具网联系我们