elasticsearch - 如何将 Kafka 批量读取到 Elasticsearch

标签 elasticsearch apache-kafka kafka-consumer-api vert.x vertx3

我对卡夫卡不太熟悉,但我想知道最好的方法是什么 从 Kafka 批量读取数据,这样我就可以使用 Elasticsearch Bulk Api 更快、更可靠地加载数据。

顺便说一句,我正在为我的 Kafka 消费者使用 Vertx

谢谢,

最佳答案

我无法判断这是否是最好的方法,但是当我开始寻找类似的功能时,我找不到任何现成的框架。我找到了这个项目:

https://github.com/reachkrishnaraj/kafka-elasticsearch-standalone-consumer/tree/branch2.0

并开始为它做出贡献,因为它并没有完成我想要的一切,而且也不容易扩展。现在 2.0 版本非常可靠,我们公司在生产中使用它每天处理/索引 3 亿多个事件。

这不是 self 推销:) - 只是分享我们如何做相同类型的工作。当然,现在可能还有其他选择。

关于elasticsearch - 如何将 Kafka 批量读取到 Elasticsearch,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33701645/

相关文章:

ElasticSearch 查询大小限制?

java - Spring Cloud Dataflow Local Server需要连接zookeeper吗?

java - 为什么 Producer.send(record).get() 有效,但 Producer.send(record, callback) 不起作用

javascript - 如何使用带有 Firebase 的 ElasticSearch 解决 'Error: connect ECONNREFUSED 127.0.0.1:9200'?

java - log4j tcp appender 和 logstash 源主机

java - Kafka - 生产者 - 句柄 "failed to send"

docker - 使用 Docker Compose 和 spotify/kafka 启动 Kafka 主题?

java - kafka连接错误: cannot find or load main class

apache-spark - 来自 Kafka 源的 Spark Streaming 返回检查点或倒带

java - 使用正则表达式从 JSON 响应中提取所有状态代码