java - 带停用词的 Solr 短语查询

标签 java solr lucene

我正在将请求发送到其中包含停用词的 Solr。 Solr版本是5.3。

查询是,其中“the”是停用词:

q:{!complexphrase}(my_field_text:"the test")

结果,Solr/Lucene 抛出异常:

null:java.lang.IllegalArgumentException: Less than 2 subSpans.size():1
at org.apache.lucene.search.spans.ConjunctionSpans.<init>(ConjunctionSpans.java:38)
at org.apache.lucene.search.spans.NearSpans.<init>(NearSpans.java:30)
at org.apache.lucene.search.spans.NearSpansOrdered.<init>(NearSpansOrdered.java:52)
at org.apache.lucene.search.spans.SpanNearQuery$SpanNearWeight.getSpans(SpanNearQuery.java:232)
at org.apache.lucene.search.spans.SpanWeight.scorer(SpanWeight.java:144)
at org.apache.lucene.search.Weight.bulkScorer(Weight.java:135)
at org.apache.lucene.search.IndexSearcher.search(IndexSearcher.java:769)
at org.apache.lucene.search.IndexSearcher.search(IndexSearcher.java:486)
at org.apache.solr.search.SolrIndexSearcher.buildAndRunCollectorChain(SolrIndexSearcher.java:200)
at org.apache.solr.search.SolrIndexSearcher.getDocListNC(SolrIndexSearcher.java:1682)
at org.apache.solr.search.SolrIndexSearcher.getDocListC(SolrIndexSearcher.java:1501)
at org.apache.solr.search.SolrIndexSearcher.search(SolrIndexSearcher.java:555)
at org.apache.solr.handler.component.QueryComponent.process(QueryComponent.java:522)
at org.apache.solr.handler.component.SearchHandler.handleRequestBody(SearchHandler.java:277)
at org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBase.java:143)
at org.apache.solr.core.SolrCore.execute(SolrCore.java:2068)
at org.apache.solr.servlet.HttpSolrCall.execute(HttpSolrCall.java:669)
at org.apache.solr.servlet.HttpSolrCall.call(HttpSolrCall.java:462)
at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:210)
at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:179)
at org.eclipse.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1652)
at org.eclipse.jetty.servlet.ServletHandler.doHandle(ServletHandler.java:585)
at org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:143)
at org.eclipse.jetty.security.SecurityHandler.handle(SecurityHandler.java:577)
at org.eclipse.jetty.server.session.SessionHandler.doHandle(SessionHandler.java:223)
at org.eclipse.jetty.server.handler.ContextHandler.doHandle(ContextHandler.java:1127)
at org.eclipse.jetty.servlet.ServletHandler.doScope(ServletHandler.java:515)
at org.eclipse.jetty.server.session.SessionHandler.doScope(SessionHandler.java:185)
at org.eclipse.jetty.server.handler.ContextHandler.doScope(ContextHandler.java:1061)
at org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:141)
at org.eclipse.jetty.server.handler.ContextHandlerCollection.handle(ContextHandlerCollection.java:215)
at org.eclipse.jetty.server.handler.HandlerCollection.handle(HandlerCollection.java:110)
at org.eclipse.jetty.server.handler.HandlerWrapper.handle(HandlerWrapper.java:97)
at org.eclipse.jetty.server.Server.handle(Server.java:499)
at org.eclipse.jetty.server.HttpChannel.handle(HttpChannel.java:310)
at org.eclipse.jetty.server.HttpConnection.onFillable(HttpConnection.java:257)
at org.eclipse.jetty.io.AbstractConnection$2.run(AbstractConnection.java:540)
at org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:635)
at org.eclipse.jetty.util.thread.QueuedThreadPool$3.run(QueuedThreadPool.java:555)
at java.lang.Thread.run(Thread.java:748)

我相信出现此问题是因为 the 被删除,只剩下 test 了。 将查询更改为 似乎工作正常,但我不确定这是否是该问题的正确解决方案:

q:{!complexphrase}(my_field_text:"the+test")

我想要的结果是搜索完整短语the test,或者至少搜索test(如果第一种情况不可能)。

最佳答案

该问题是由于 {!complexphrase} 引起的。
使用此解析器时需要转义特殊符号两次。
所以“测试”应该是:

"the\\\ test"

第一次转义之后,将是“the\test”。第二个之后 - “the\\test”。

关于java - 带停用词的 Solr 短语查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59290271/

相关文章:

search - Solr:长度标准化/omitNorms = false有什么好处?

java - `lucene 5.0.0` 的 SmartChineseAnalyzer 可以指定或添加我的自定义词典吗?

elasticsearch - 如何在不影响性能,可扩展性的前提下获得更好的相关性,以及如何避免Elasticsearch的分片效应

java - 全局级别的 JMeter cookie 管理器

java - Maven 在构建期间排除文件

用于部分文档更新的 solrj api

ruby-on-rails - 几个非常具体的elasticsearch问题

java - 将文件写入java问题

java - Json 使用 Jackson 库序列化 JDK 动态代理

solr - EdgeNGramFilterFactory 中的精确结果(Solr 搜索)