algorithm - 在不使用字典的情况下识别拼写错误的算法是什么?

标签 algorithm spell-checking

请考虑以下情况:在一段文本中,字符串“slnFile”出现了五次,“snlFile”出现了一次。后者是拼写错误,但请注意,前一个单词不在正确的字典中(“slnFile”是一个变量名称,表示“Visual Studio 解决方案文件”,仅对文本段的作者有意义)。

我自己可以想到一种简单的拼写检查实现:查找文本段中拼写有一个字符不同的所有单词对,将频率计数为 1 的任何单词指示为可疑单词。 (我知道这不是一个完美的解决方案。)

我的问题:处理这个问题的算法类的名称是什么?

最佳答案

计算Damerau-Levenshtein distance词汇表中所有单词之间。标记那些很少出现并且与经常出现的单词距离特别小的单词。

关于algorithm - 在不使用字典的情况下识别拼写错误的算法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18729059/

相关文章:

thread-safety - Hunspell 线程安全吗?

algorithm - 在哪里可以了解有关 Google 搜索 "did you mean"算法的更多信息?

N次绕任意非自交闭合多边形移动点的算法

algorithm - 如果你得到 7 则返回 3 的所有方法,反之亦然 - 面试问题

algorithm - O(log(log(n))))-competitive 是什么意思?

c++ - 生成径向梯度的算法

javascript - Grammarly 如何知道红色下划线的位置?

java - 将单词添加到语言工具建议列表

ms-office - 如何为 Microsoft Office 实现拼写检查器?

algorithm - 有什么好的方法可以分解高斯整数?