solr 建议者不返回任何结果

标签 solr spell-checking autosuggest

我已经按照 solr wiki 文章为建议者几乎到了 T 这里:http://wiki.apache.org/solr/Suggester .我的 solrconfig.xml 中有以下 xml:

<searchComponent class="solr.SpellCheckComponent" name="suggest"> 
     <lst name="spellchecker"> 
     <str name="name">suggest</str> 
     <str name="classname">org.apache.solr.spelling.suggest.Suggester</str> 
     <str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str> 
     <str name="field">description</str> 
     <float name="threshold">0.05</float> 
     <str name="buildOnCommit">true</str> 
   </lst> 
</searchComponent> 
<requestHandler class="org.apache.solr.handler.component.SearchHandler" name="/suggest"> 
   <lst name="defaults"> 
     <str name="spellcheck">true</str> 
     <str name="spellcheck.dictionary">suggest</str> 
     <str name="spellcheck.onlyMorePopular">true</str> 
     <str name="spellcheck.count">5</str> 
     <str name="spellcheck.collate">true</str> 
   </lst> 
   <arr name="components"> 
     <str>suggest</str> 
   </arr> 
</requestHandler> 

但是,当我运行以下查询(或类似查询)时:
../suggest/?q=barbequ

我只得到以下结果xml:
<response>
   <lst name="responseHeader">
      <int name="status">0</int>
      <int name="QTime">78</int>
   </lst>
   <lst name="spellcheck">
      <lst name="suggestions"/>
   </lst>
</response>

如您所见,这不是很有帮助。有什么建议可以帮助解决这个问题吗?

最佳答案

我能想到的一些事情可能会导致这个问题:

  • 源字段(“描述”)不正确 - 确保这确实是为您的拼写检查器播种术语的字段。该字段甚至可能是不同的情况(例如,“描述”而不是“描述”)。
  • schema.xml 中的源字段设置不正确或正在被过滤器处理,导致源字典无效。我使用一个单独的字段来播种字典,并使用 <copyfield />将相关的其他字段复制到该字段。
  • 术语“烧烤”没有出现在至少 5% 的记录中(您已经通过包含 <float name="threshold">0.05</float> 表明了这个要求),因此不包括在查找字典
  • 中。
  • 在 SpellCheckComponent 中,<str name="spellcheck.onlyMorePopular">true</str>设置意味着只有会产生更多结果的术语才会作为建议返回。根据 Suggester 文档,它具有不同的功能(按重量对建议进行排序),但可能值得将其切换为 false 以查看是否是导致问题的原因。

  • 我的 schema.xml 的相关部分:
    <schema>
        <types>
            <!-- Field type specifically for spell checking -->
            <fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100" omitNorms="true">
                <analyzer type="index">
                    <tokenizer class="solr.StandardTokenizerFactory" />
                    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                    <filter class="solr.LowerCaseFilterFactory" />
                    <filter class="solr.StandardFilterFactory" />
                </analyzer>
                <analyzer type="query">
                    <tokenizer class="solr.StandardTokenizerFactory" />
                    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
                    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                    <filter class="solr.LowerCaseFilterFactory" />
                    <filter class="solr.StandardFilterFactory" />
                </analyzer>
            </fieldType>
        </types>
        <fields>
            <field name="spell" type="textSpell" indexed="true" stored="false" multiValued="true" />
        </fields>
    
        <!-- Copy fields which are used to seed the spell checker -->
        <copyField source="name" dest="spell" />
        <copyField source="description" dest="spell" />
    <schema>
    

    关于solr 建议者不返回任何结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6653186/

    相关文章:

    iphone - 如何检查 TextView 中输入的拼写?

    dataset - 二元拼写检查算法的测试数据的良好来源?

    php - GWT TinyMCE拼写检查

    java - 使用 Lucene 索引单个 Xml 文件

    mysql - 使用 Solr,我还需要 SQL 数据库吗?

    java - 在 MongoDB 和 Apache Solr 之间同步数据的简单方法

    c# - WPF应用程序的自动完成功能

    php - 你如何使用日光浴室在 solr 中分页?

    javascript - jquery自动完成匹配

    javascript - React - Axios promise 未定义的未决值