solr - 用SOLR和LowerCaseFilterFactory索引字段

我有一个字段定义为

<fieldType name="text_ws_lc" class="solr.TextField" positionIncrementGap="100">
  <analyzer type="index">
    <tokenizer class="solr.WhitespaceTokenizerFactory"/>
    <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
    <tokenizer class="solr.WhitespaceTokenizerFactory"/>
    <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/>
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

对于这种类型的字段，在不区分大小写的情况下进行搜索非常有效。但是，我希望将原始值插入到字段中，而不是小写值。是否可以从索引分析器中删除LowerCaseFilterFactory并获得此功能？翼

<fieldType name="text_ws_lc_std" class="solr.TextField" positionIncrementGap="100">
  <analyzer type="index">
    <tokenizer class="solr.WhitespaceTokenizerFactory"/>
    <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
    <tokenizer class="solr.WhitespaceTokenizerFactory"/>
    <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/>
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

最佳答案

您应该定义两个字段:一个带有小写值用于搜索，另一个用于保存原始值。您可以在schema.xml中使用复制字段指令来使两个字段保持同步。

关于solr - 用SOLR和LowerCaseFilterFactory索引字段，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3134702/

solr - 用SOLR和LowerCaseFilterFactory索引字段

上一篇：grails - 在Grails中强制使用https

下一篇：entity-framework - 具有多个 Entity Framework 模型的单个连接字符串？