algorithm - 查找文本所需的工具或 API 包含大型词典中的任何单词

标签 algorithm search full-text-search

我正在寻找一种工具(理想情况下)或未能找到一个 API 来从大量文本文件中的大量单词词典中搜索文本以查找任何单词的实例。在我的例子中,“单词”实际上是文件名,但不包含空格。

快速算法可能会通过读取字典来构建 DFA(确定性有限自动机),然后能够使用单次遍历在任意数量的文件中查找字典单词的实例。

注意:我想要精确的文本匹配而不是像这个 SO 问题那样的模糊匹配: - Algorithm wanted: Find all words of a dictionary that are similar to words in a free text

最佳答案

你看过lucene吗?有java和.net版本

http://lucene.apache.org/java/docs/index.html

关于algorithm - 查找文本所需的工具或 API 包含大型词典中的任何单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6674638/

相关文章:

java - 以下代码中的 “- 97” 是什么意思?

android - Textwatcher 无法识别空格

javascript - JS - 如何在尚未创建的 HTML 页面中进行搜索? (动态 HTML)

php - 使用 utf8 的 MySQL 全文搜索(波斯语/阿拉伯语)

mysql - boolean 全文搜索排除短语 AB-CD,例如-"AB-CD"?

algorithm - 当有很多用户和文件/目录时,一种快速查找给定用户和路径的文件或目录的方法

python - python中的递归和return语句

algorithm - 二维空间中的最短路径和排序点

algorithm - 对 n 个值进行排序所需的比较次数?

python - 谷歌应用程序引擎Python中基于地理空间和位置的搜索