lucene - 了解lucene段

标签 lucene

我在一个文件夹中有这 3 个文件,它们都与 Lucene 创建的索引相关:

  • _0.cfs
  • segment_2
  • segment.gen

  • 它们都用于什么,是否可以将它们中的任何一个转换为人类可读的格式,以更多地了解 lucene 如何与其索引一起工作?

    最佳答案

    两个segment文件存储了segment的信息,.cfs是由其他索引文件(如索引、存储、删除等文件)组成的复合文件。

    有关用于创建 Lucene 索引的不同类型文件的文档,请参阅此 summary of file extensions

    一般来说,不,Lucene 文件不是人类可读的。它们的设计更注重效率和速度,而不是人类可读性。获得人类可读格式的方法是通过 Lucene API(通过 Luke 或 Solr 或类似的东西)访问它们。

    如果您想彻底了解所使用的文件格式,codecs package将是看的地方。

    关于lucene - 了解lucene段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17622732/

    相关文章:

    search - 在 sitecore 中搜索内容项时出错

    elasticsearch - Lucene 查询中的顺序会影响结果吗?

    mysql - lucene/solr vs mySQL 5.6 LIKE(包含)搜索——迁移到 solr 会提高速度吗?

    Solr:对带空格的字符串使用通配符

    lucene - 如何使用原生 Lucene 查询语法?

    java - 获取 xml 元素的字节/字符偏移量

    java - Lucene 内部如何执行删除?

    c# - Lucene.NET - 查找不包含指定字段的文档

    python - 如何将 StandardAnalyzer 与 TermQuery 一起使用?

    java - Lucene索引和Map/Reduce搜索