我的问题是,我要开发一个网站,每个人都上传 doc 文件、txt 文件等。现在我需要一个组件,它实际上可以解析文件中的一些关键字并维护其索引。而且该索引也应该基于结构化数据进行更新,例如文档可以主动查看等等。当另一个用户尝试根据前面提到的某些关键字和一些结构化数据来查找文档列表时,用户应该快速找到该列表。并且它应该支持多语言。我们已经有了一个算法,但我们需要一个开源 API 来读取文件,并使用基于关键字的非结构化数据对文件进行索引。任何人都可以帮忙解决这个问题吗?
最佳答案
关于java - 我需要使用 Java 创建搜索引擎的帮助,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5117010/