java - 修改Lucene索引中的.tim和.tip文件

标签 java lucene

我有一个包含多个索引的 Lucene 应用程序,其中相关性评分由于不同索引之间的术语频率差异而受到影响。我的理解是,术语词典(.tim 文件)包含“术语统计信息”,例如每个术语的文档频率统计信息。我认为一种方法可能是修改每个索引(和相关段)的 .tim 文件并更新“术语统计信息”。是否可以通过这种方式覆盖或修改 .tim 和 .tip 文件?

最佳答案

relevancy scoring suffers

来自FAQ :

score values are meaningful only for purposes of comparison between other documents for the exact same query and the exact same index. when you try to compute a percentage, you are setting up an implicit comparison with scores from other queries.

关于java - 修改Lucene索引中的.tim和.tip文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24412795/

相关文章:

java - Lucene 区分大小写和不区分大小写的搜索

java - spring 应用程序如何在 war 之外保留属性文件

java - 避免每次在 spring 中检查 dto 处的非空和非空变量

iphone - Apache Lucene 或其他 iPhone 应用程序中的搜索

elasticsearch - 在Kibana上查询Lucene Discover是否无法正常工作?

solr - solr 是否使用余弦相似度?

java - 如何使用JAVA执行psexec的cmd行并在一行中登录到文本文件?

java - 文本文件的字节加密

java - 如何查看应用程序中的上一个屏幕

lucene - Elasticsearch Multindex性能