我正在研究倒排索引,我的问题是:在最后一步中,我们应该返回该单词出现的文档总数还是仅返回每个文档编号? 例如 : 如果单词“Hello”出现在3个文档(文档A和文档B和文档C)中,我应该返回3或A,B,C?
最佳答案
索引意味着它可以让您查找某些内容,而不仅仅是一个数字。频率计数将为您提供单词出现次数的计数。
顺便说一句,您可以从 A、B、C 获取号码,但反之则不然。
关于java - 倒排索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23524205/