solr - 将 Solr-5.2.1 与从 Nutch 抓取的数据集成?

标签 solr nutch

教程说:

Nutch already created crawl data from the seed URL(s). Below are the steps to delegate searching to Solr for links to be searchable:

Backup the original Solr example schema.xml:

mv ${APACHE_SOLR_HOME}/example/solr/collection1/conf/schema.xml ${APACHE_SOLR_HOME}/example/solr/collection1/conf/schema.xml.org

但问题是没有像/example/solr/collection1/conf这样的目录

我会在哪个目录中找到这个 schema.xml 文件?或者要替换哪个 schema.xml 文件?

最佳答案

AFAIK Solr 5.x 默认使用托管模式,它将根据输入文档动态创建。但是,您可以将 schema.xml 文件内容复制到 ${APACHE_SOLR_HOME}/solr/server/solr/$CORE_NAME/conf/managed-schema。但在复制您的架构之前,请确保它采用 5.x 架构格式。 (一些旧的模式组件可能已经改变)

关于solr - 将 Solr-5.2.1 与从 Nutch 抓取的数据集成?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30987830/

相关文章:

hibernate - 如何在tomcat上使用maven在spring MVC中集成apache solr

mysql - 数据从mysql导入到solr?

java - 如何通过 Java 应用程序使用 Apache Nutch?

nutch - nutch 1.3 中重新抓取 URL

solr - Nutch 并将抓取数据保存到 Amazon S3

Solr4目前只看默认的 "df"字段,如何搜索多个字段?

python - Django/haystack - 仅基于 DateField 的年份元素进行分面

java - Zookeeper Ensemble 不响应客户端?

Nutch:以一定深度抓取每个 URL

java - Nutch - 无法从资源 org/sonar/ant/antlib.xml 加载定义