我正在考虑/致力于为我们公司的各种内容类型实现一个搜索引擎,并尝试着迷于 Lucene(特别是 .net 风格)。
目前,我的主要问题是索引的文档是否必须包含相同的字段。
例如:
文档1:
- 标题:“我是一份文件,宝贝”
- 正文:“这里有一些重要的事情”
- 纬度:26.12224
- 经度:-65.23124
- 品牌:东芝
文档2:
- 标题:“我的另一份文档”
- 正文:“Lorem ipsum 和所有爵士乐”
- 类别:文章
- 作者:Loin 爵士
...等等
最佳答案
lucene 中没有任何东西强制一致性。
如果您搜索名为“fred”的字段,并且并非所有文档都有“fred”,则该搜索将找不到无 fred 的文档。
关于lucene - Lucene 中的文档必须包含相同的字段吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2066880/