lucene - Lucene 中的文档必须包含相同的字段吗?

标签 lucene lucene.net

我正在考虑/致力于为我们公司的各种内容类型实现一个搜索引擎,并尝试着迷于 Lucene(特别是 .net 风格)。

目前,我的主要问题是索引的文档是否必须包含相同的字段。

例如:

文档1:

  • 标题:“我是一份文件,宝贝”
  • 正文:“这里有一些重要的事情”
  • 纬度:26.12224
  • 经度:-65.23124
  • 品牌:东芝

文档2:

  • 标题:“我的另一份文档”
  • 正文:“Lorem ipsum 和所有爵士乐”
  • 类别:文章
  • 作者:Loin 爵士

...等等

最佳答案

lucene 中没有任何东西强制一致性。

如果您搜索名为“fred”的字段,并且并非所有文档都有“fred”,则该搜索将找不到无 fred 的文档。

关于lucene - Lucene 中的文档必须包含相同的字段吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2066880/

相关文章:

elasticsearch - 模糊查询不返回记录

security - Solr 架构更改不会丢失数据且无需使用动态字段

java - 使用 TermQuery 的 Lucene 搜索仅适用于 WhitespaceAnalyzer,但不适用于 StandardAnalyzer

java - 配置 nutch regex-normalize.xml

java - 使用 Apache Lucene 创建出现 vector

asp.net-mvc - 无法使用 Lucene.Net 和 Azure 应用服务访问 Azure 存储

java - Solr 仅在子查询匹配时返回父文档

sorting - 影响结果排序顺序的文档分数,Lucene

lucene - SpatialQuery 使用 Lucene 进行基于位置的搜索

solr - 使用 ravenDB 进行空间搜索