我正在寻找一种工具(理想情况下)或未能找到一个 API 来从大量文本文件中的大量单词词典中搜索文本以查找任何单词的实例。在我的例子中,“单词”实际上是文件名,但不包含空格。
快速算法可能会通过读取字典来构建 DFA(确定性有限自动机),然后能够使用单次遍历在任意数量的文件中查找字典单词的实例。
注意:我想要精确的文本匹配而不是像这个 SO 问题那样的模糊匹配: - Algorithm wanted: Find all words of a dictionary that are similar to words in a free text
最佳答案
你看过lucene吗?有java和.net版本
关于algorithm - 查找文本所需的工具或 API 包含大型词典中的任何单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6674638/