full-text-search - 在 Solr 中,如何针对一个字段查询多值字段中不同的一组值

标签 full-text-search solr parallel-processing multivalue

我基本上希望 Solr 为我的搜索参数搜索多值字段的每条记录。继续阅读我的示例:

我正在使用 Solr 来索引我的数据。我有匹配给定产品的并行数组中的应用程序数据(以多值字段的形式)。请参见以下示例,其中 make、model 和 year 是多值字段:

<-solr record start-><br/> sku: 1234 <br/> make: acura, acura, acura <br/> model: integra, rsx, rsx<br/> year: 1997, 2004, 2000<br/> engine: 3.4, 4.5, 4.5<br/> <-solr record end->

我正在使用过滤器查询 (&fq=) 来缩小我的选择范围。问题是,如果有人查找 2000 Acura Integra,它会匹配上面的记录,但由于制造商、型号和年份数据是并行编码的,因此实际上没有该产品的 2000 Acura Integra。 Solr 在 make 字段中匹配 make,在 model 字段中匹配模型,在 year 字段中匹配年份(应该如此)并返回此结果,并且不尊重我的并行性。 到目前为止,我的查询看起来像这样:

<br/> fq=make:"acura"&fq=model:"integra"&fq=year:2000 <i>(I would normally escape URL characters when I POST to Solr, this is just an example)</i>

所以我的解决方案是创建另一个多值字段,称为摘要字段,我将在其中将所有品牌、型号、年份和其他数据(如引擎)放在一起,并用空格分隔。有必要在单词周围加上引号,这样具有多个单词的术语就不会无意中匹配搜索参数。上面的例子现在看起来像这样:

<-solr record start-><br/> sku: 1234 <br/> make: acura, acura, acura <br/> model: integra, rsx, rsx<br/> year: 1997, 2004, 2000<br/> engine: 3.4, 4.5, 4.5<br/> summary: "acura" "integra" "1997" "3.4", "acura" "rsx" "2004" "4.5", "acura" "rsx" "2000", "4.5"<br/> <-solr record end->

然后我将以下内容添加到我的查询中:

summary:(""acura" AND "integra" AND "2000")

我希望,如果我将其添加到我的查询中,则该记录将不再出现,因为摘要字段中没有 acura integra 2000。但是,这是行不通的。记录仍然出现。我很难过。有没有人能解决这个问题。这几天一直在折磨我。

我基本上希望 Solr 为我的搜索参数搜索多值字段的每条记录。这可能吗?有没有更好的方法来完成我想做的事情?

谢谢

最佳答案

看来您的架构不太正确。您需要完全非规范化数据并为每辆车创建一个文档。 “车辆”的含义取决于您将运行哪种搜索。例如,一个可能的模式是:

sku: 1234
make: acura
model: integra
years: 1997
engines: 3.4, 4.5

sku: 1235
make: acura
model: rsx
years: 2000, 2004
engines: 4.5

摘要字段将是 make+model+years+engines 的 copyField

关于full-text-search - 在 Solr 中,如何针对一个字段查询多值字段中不同的一组值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2243093/

相关文章:

PostgreSQL 重音 + 不区分大小写的搜索

java - 带开始和行的 Spring Data solr

在 R 中并行运行 for 循环

python - joblib 的中间结果

javascript - 全文搜索本地/离线网络 "site"

sql-server - SQL 包含确切的短语

mysql - Alfresco CMIS 全文查询不起作用

php - 如何将 mysql 表导入 SOLR

java - 如何停止创建 .mdmp 文件

Scala 任务与参与者的并行化 => 调度程序如何工作?