我有兴趣从维基百科转储中搜索包含一对单词的特定句子。一种方法是在提取转储 XML 后遍历所有文档。有没有更好的解决办法?
最佳答案
我建议使用内容的倒排索引。您可以使用 Lucene、Elastic Search、Solr 等。
以下是使用 Lucene 索引的示例:Wikipedia index using lucene
关于java - 在java中从维基百科转储中搜索文本的最佳方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47981956/