solr - 将 Solr-5.2.1 与从 Nutch 抓取的数据集成？

教程说:

Nutch already created crawl data from the seed URL(s). Below are the steps to delegate searching to Solr for links to be searchable:

Backup the original Solr example schema.xml:

mv ${APACHE_SOLR_HOME}/example/solr/collection1/conf/schema.xml ${APACHE_SOLR_HOME}/example/solr/collection1/conf/schema.xml.org

但问题是没有像/example/solr/collection1/conf这样的目录。

我会在哪个目录中找到这个 schema.xml 文件？或者要替换哪个 schema.xml 文件？

最佳答案

AFAIK Solr 5.x 默认使用托管模式，它将根据输入文档动态创建。但是，您可以将 schema.xml 文件内容复制到 ${APACHE_SOLR_HOME}/solr/server/solr/$CORE_NAME/conf/managed-schema。但在复制您的架构之前，请确保它采用 5.x 架构格式。 (一些旧的模式组件可能已经改变)

关于solr - 将 Solr-5.2.1 与从 Nutch 抓取的数据集成？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30987830/

上一篇：fortran - 在 FORTRAN 中将数字定义为参数是否有性能优势

下一篇：r - 如何在不丢失名称的情况下向列表中的列表添加列？

mysql - 数据从mysql导入到solr？

java - 如何通过 Java 应用程序使用 Apache Nutch？

nutch - nutch 1.3 中重新抓取 URL

solr - Nutch 并将抓取数据保存到 Amazon S3

Solr4目前只看默认的 "df"字段，如何搜索多个字段？

python - Django/haystack - 仅基于 DateField 的年份元素进行分面

java - Zookeeper Ensemble 不响应客户端？

Nutch:以一定深度抓取每个 URL

java - Nutch - 无法从资源 org/sonar/ant/antlib.xml 加载定义