apache-kafka - 我们是否可以选择从特定时间段/时间戳获取 KSQL 流中的数据

标签 apache-kafka ksqldb confluent-platform

我知道,在 KSQL 中我们可以将偏移量设置为最早或最新但我们能否从特定时间段获取数据,即我需要从 2020 年 5 月 6 日开始将数据插入主题?

最佳答案

在 ksqlDB 中,您可以从主题的开头(SET 'auto.offset.reset' = 'earliest';)或主题的结尾(SET 'auto.offset.reset' = '最新';).

您目前 (0.8.1/CP 5.5) 无法寻找任意偏移量。

可以做的是从最早的偏移量开始,然后在您的谓词中使用ROWTIME 来识别符合您要求的消息。

SELECT * 
  FROM MY_SOURCE_STREAM 
WHERE  ROWTIME>=1588772149620

请注意,这会按顺序扫描,因此根据您主题中的数据量,扫描速度可能不会特别快。

关于apache-kafka - 我们是否可以选择从特定时间段/时间戳获取 KSQL 流中的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61633537/

相关文章:

java - Kafka Streams : topic. Compression.type 不是已知配置

hadoop - Kafka 控制台生产者丢失消息

apache-kafka - 从消费者开始时从主题中获取最新值,然后正常继续

java - 如何将 mssql jdbc 驱动程序安装到 confluence/kafka

apache-kafka - Kafka Nodes 和 zookeeper 将如何相互通信?

java - @KafkaListener 正常关闭,批处理 Kakfa 监听器不工作

apache-kafka - 如何从嵌套 JSON 对象创建 KSQLdb 流字段

apache-kafka - 是否可以从 ksql 流创建 ksql 表?

elasticsearch - kafka avro elasticsearch消费者允许未知键