search - 模糊搜索 + 倒排索引

标签 search text indexing fuzzy-search

我正在研究模糊搜索以及如何使用倒排索引从数据库中检索信息。我研究了倒排索引,我认为它只适用于完全匹配。想象一下我有字符串 East Lamar Street 的情况在我的数据库中。有人在找 East Lmar Street我要找什么East Lamar Street .

它会使用编辑距离吗?

算法将如何运作?

数据库会使用倒排索引吗?

或者它会做一个完整的扫描?

我看到它使用散列在 O(1) 中进行操作。

最佳答案

我写了一个小库,它使用 Soundex 按单词索引,并在整个短语上使用 Levenshtein 距离进行评分。有一个 Scala 和 C# 版本。如果您负担得起将所有街道名称加载到内存中,则可以使用它。否则,您可能会采用一些来源并以不同的方式使用它。

https://github.com/rstokes/fuzzysearch

关于search - 模糊搜索 + 倒排索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6714876/

相关文章:

search - 如何从 Google 搜索中聚合数据

performance - Elasticsearch使用源字段进行大数据检索时性能下降

html - 如何选择 div 中的两个不同输入类型的文本?

c# - 获取筛选后的 DataGrid 中选定行的索引

r - 查找 NA 在 0 和 1 之间的行

MySQL索引设计与表分区

excel - 在字符串 VBA 中搜索数字

java - 在矩形流中进行快速点搜索

java - 如何在 FXML 文件中将文本分成多行并附加它们

javascript - 如何在鼠标悬停时突出显示不同div中的文本和图像