apache-kafka - 有没有办法对 Kafka 流中的输入主题进行重新分区?

标签 apache-kafka apache-kafka-streams

我有一个由 byte[] 键控的主题,我想对其进行重新分区并通过消息正文中某个字段中的另一个键来处理该主题。

我发现有 KGroupedStreamgroupby 函数。但它要求聚合函数转换为 KTable/KStream。我不需要聚合。我只想重新分区并处理输出。

最佳答案

是的,你可以。您设置一个新 key ,然后通过另一个主题传输数据。

// repartition() will create the required topic automatically for your,
// with the same number of partitions as your input topic;
//
// it's also possible to set the number of partitions explicitly to scale in/out
// via `repartitioned(Repartitioned.numberOfPartitions(...))`
KStream stream = ...
KStream repartionedStream = stream.selectKey(...)
                                  .repartition();

// older versions:
//
// using `through()` you need to create the use topic manually,
// before you start your application
KStream stream = ...
KStream repartionedStream = stream.selectKey(...)
                                  .through("topic-name");

请注意,在启动具有所需数量分区的应用程序之前,您需要创建在 through() 中使用的主题。

关于apache-kafka - 有没有办法对 Kafka 流中的输入主题进行重新分区?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49578931/

相关文章:

java - Kafka 流关闭并且不运行

java - Kafka Streams 在多个流中拆分 1 个流

apache-kafka - Flink 表 API : GROUP BY in SQL Execution throws org. apache.flink.table.api.TableException

java - 简单的 Kafka 消费者没有收到消息

apache-kafka - 增加连接窗口大小和设置宽限期之间的区别

apache-kafka - 无法在具有多个主题分区的 Kafka Streams 中重新平衡错误

apache-kafka - 未能构建 kafka 消费者

java - 如何更改Kafka拓扑的消费者偏移量?

apache-kafka - 如何检查 Kafka 使用了多少磁盘空间

apache-kafka - Kafka 多个生产者写入同一主题 - 消息和数据突发的排序