我有一个包含多个索引的 Lucene 应用程序,其中相关性评分由于不同索引之间的术语频率差异而受到影响。我的理解是,术语词典(.tim 文件)包含“术语统计信息”,例如每个术语的文档频率统计信息。我认为一种方法可能是修改每个索引(和相关段)的 .tim 文件并更新“术语统计信息”。是否可以通过这种方式覆盖或修改 .tim 和 .tip 文件?
最佳答案
relevancy scoring suffers
来自FAQ :
score values are meaningful only for purposes of comparison between other documents for the exact same query and the exact same index. when you try to compute a percentage, you are setting up an implicit comparison with scores from other queries.
关于java - 修改Lucene索引中的.tim和.tip文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24412795/