elasticsearch - 如何在Nutch中使用Elasticsearch 5.x/如何在Elasticsearch 5中索引HTML网页?

标签 elasticsearch solr nutch elasticsearch-plugin elasticsearch-5

我正在使用Apache Nutch将网页索引到Elasticsearch中。
当我尝试像this一样进行升级时,我在ElasticSearchWriter.java中遇到错误。
有没有人尝试过?
Nutch是否仅支持到ES2.x?
还是有其他简单的方法可以在ES中索引HTML页面?
提前致谢。

最佳答案

我刚刚完成了针对Apache Nutch 2.3.1到ElasticSearch 5.1.1的实现。这应该能够向后移植到早期版本。让我知道您是否需要其他版本...

试试这个:

https://github.com/mdigiacomi/indexer-elastic

关于elasticsearch - 如何在Nutch中使用Elasticsearch 5.x/如何在Elasticsearch 5中索引HTML网页?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41431127/

相关文章:

solr - Nutch:数据读取和添加元数据

elasticsearch - ElasticSearch Multi Match字段增强似乎不起作用?

elasticsearch - ElasticSearch查询嵌套对象无法按预期工作

performance - Algolia 与 Solr 搜索

apache - 将 Apache Solr 索引从 1.x 升级到 5.x(或更高版本)

hadoop - Hadoop + Nutch 1.15 + Solr Cloud 7.3.1索引无结果

elasticsearch - Elasticsearch奇怪的过滤器行为

elasticsearch - ES主机名作为响应

java - Lucene Solr 使用复杂的过滤器

elasticsearch - 我应该在 Elasticsearch 中使用 Nutch 1x 还是 2x