java - Solr 查询结果 - 需要搜索文本及其周围的几行

标签 java solr search-engine document

我完全迷失了。 我想我在这里肯定遗漏了一些基本的东西。每个人都有关于 Solr 的精彩言论,但我却看不到。

我在 Solr 中索引了一个结构化 pdf 文档。 问题是当我搜索一个简单的字符串时 - 我得到整个内容字段作为响应! 我不知道如何改变它。 我的要求是,假设我搜索“元数据” 它应该给我

元数据讨论 . . . 4 场比赛 ...确保 Tika 用户有机会访问 Tika 创建和/或提取的所有元数据。 == 原始问题 == 此页面的最初灵感是 Tika ... 10.7k - 转速:2​​(当前) 最后修改: 2010-08-02 18:09:45 “

但它给了我整个文档! - 被索引的整个字符串。 看来Lucene只能告诉我它发生在哪个领域,而不能告诉我它发生在哪个领域

任何帮助将不胜感激!!

最佳答案

Lucene/Solr 主要是一个检索引擎 - 它检索与查询匹配的文档。所以这种行为是可取的和预期的。现在,根据您的要求,您可以使用highlighting Solr 的功能正是为您提供的。假设您的文档文本存储在名为 text 的字段中 - 那么您将向 Solr 传递以下参数:

&hl=true&hl.fl=text&hl.snippets=5&hl.fragsize=200

查看其他参数以进一步自定义它。

Solr 了不起:)

关于java - Solr 查询结果 - 需要搜索文本及其周围的几行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10661466/

相关文章:

javascript - 如何为我自己的搜索引擎获取初始索引数据?

java - 从 Java : passing functions as parameters 使用 Scala

java - 如何确定mockito中的Mock和injectMock对象?

java - 如何在网站中创建即时通知系统

java - Java执行-f选项

Drupal 与近实时搜索 Solr

solr - 如何在 SOLR 中索引文档?

java - SOLR 6.2 忽略堆设置(SOLR_JAVA_MEM 参数)

javascript - 有没有办法以 JSON 格式获取 google 搜索结果?

search - 我是否需要在Elasticsearch过滤器中优化 bool 表达式?