java - 如何修改Solr给出的搜索结果页面?

标签 java solr search-engine nutch

我打算做一个利基搜索引擎。我使用 apache-nutch-1.6 作为爬虫,使用 apache-solr-3.6.2 作为搜索器。我必须说网络上有关这些技术的更新信息非常少。

我遵循了本教程 http://wiki.apache.org/nutch/NutchTutorial并已在我的 ubuntu 系统上成功安装 apache 和 solr。我还成功地将种子 url 注入(inject)到 webdb 并执行爬网。

使用http://localhost:8983/solr/admin的solr接口(interface),我还可以查询爬取的结果。但这是我收到的输出。 enter image description here .

我在这里遗漏了什么吗,早期的 apache-nutch-0.7 有一场 war ,它生成了这样清晰的 html 输出。 enter image description here 。我如何实现这一点...或者如果有人可以向我指出最新的教程或指南,非常感谢。

最佳答案

有几件事:

  • 如果您刚刚开始,请不要使用 Solr 3.6,直接使用最新的 4.1+。许多事情发生了变化,并添加了许多新功能。
  • 您似乎在说您将直接向一般 Web 公开 Solr + UI - 这是一个非常糟糕的主意,因为 Solr 完全不安全并且允许基于 Web 的删除查询。您确实需要中间有一个业务层。
  • 在 Solr 4.1 中,有一个漂亮的管理 UI,还有一个/browse 页面,展示了如何使用 Velocity 来执行 Solr 支持的页面。或者看看类似 Project Blacklight 的内容有关如何通过 Solr 获取 UI 的示例。

关于java - 如何修改Solr给出的搜索结果页面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14728903/

相关文章:

java - 如何解析 XML 以从中返回 Map?

java - JNLP 和 JavaFX 之间的区别

java - 在 html 表(jsp 页面)中输出 JSON 数组

Solr 字符串字段类型最大可索引字符数

java - 如何在c++或java代码中调用搜索引擎

java - 使用 mysql J 连接器连接到 memsql 时出错

grails - 将独立的Solr搜索服务器与grails域object_集成

solr - Lucene:无需重新索引即可迁移 Java 版本

java - 用 Java 获取 Google 结果?需要帮忙!

html - 使用响应式设计搜索...宽度 100%?