我最近遇到了一个问题,很想听听关于这个主题的任何想法。
前提:
主要思想:将 JDK 版本从 1.6 更改为 1.8。
那么,此更改是否需要重新索引索引或 不是 ?
我发现的第一件事是 JRE_VERSION_MIGRATION文档。但它只说明了一个与 Unicode 版本的变化和 Java 1.4 到 Java 5 过渡相关的已知问题。
我没有发现不同 JDK 版本中 Unicode 版本的任何其他已知问题,这些问题可能需要对现有 Lucene 索引进行完全重新索引。
另外,有人知道与 JKD 1.6 和 JDK 1.7(1.8) 中不同版本的 Unicode 相关的一些问题吗?
谢谢!
附言
此外,这是用于以下用途的所有分析器和过滤器的列表:
最佳答案
我怀疑您是否需要重新编制索引。
Unicode 6.1 添加了这些可能被 CJK 分析器“看到”的符号:
CJK Compatibility Ideographs {F900..FAFF} : 2 characters (U+FA2E and U+FA2F)
CJK Unified Ideographs {4E00..9FFF} : 1 character (U+9FCC = Adobe-Japan1-6 CID+20156, a variant of U+6DBC 涼)
其他变化在理论上甚至不会影响这些分析器。
Unicode 6.2 版本更简单,它只有一个新字符
U+20BA TURKISH LIRA SIGN
我认为没有必要重新索引。上面的分词器依赖于
Character.isLetter()
不受上述变化影响的方法。我严重怀疑更改中列出的任何字符都在索引中。
关于solr - Lucene:无需重新索引即可迁移 Java 版本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29259324/