我在使用 tire gem 理解 elasticsearch 中分析器的概念时遇到了问题。我实际上是这些搜索概念的新手。这里有人可以帮助我提供一些引用文章或解释分析器的实际作用以及使用它们的原因吗?
我看到在 elasticsearch 中提到了不同的分析器,例如关键字、标准、简单、雪球。在不了解分析仪的情况下,我无法弄清楚什么才是真正适合我的需要。
最佳答案
让我给你一个简短的回答。
分析器在索引时间和搜索时间使用。 它用于创建术语索引。
要索引一个短语,将其分成单词可能很有用。 分析仪来了。
它应用分词器和分词过滤器。 分词器可以是 Whitespace 分词器。它在每个空格处将一个短语拆分为标记。 小写分词器将在每个非字母处拆分一个短语并将所有字母小写。
token 过滤器用于过滤或转换某些 token 。例如,ASCII 折叠过滤器会将 ê、é、è 等字符转换为 e。
分析器是所有这些的组合。
你应该阅读 Analysis guide并查看您拥有的所有不同选项。
默认情况下,Elasticsearch 应用标准分析器。它将删除所有常见的英语单词(以及许多其他过滤器)
您还可以使用 Analyze Api了解它是如何工作的。非常有用。
关于elasticsearch - Elasticsearch 中的分析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12836642/