streaming - 最大喷嘴容量

标签 streaming spark-streaming apache-storm iot heron

我正在使用 Heron 对 IoT 数据执行流分析。目前该架构中只有一个并行度为 1 的 Spout。

我正在尝试对 Heron 在 Spout 内部使用的队列中可以保存的数据量的统计数据进行基准测试。

我正在通过向 setMaxSpoutPending() 方法传递值来使用该方法。我想知道我们传递给这个方法的数量是否有限制?

我们可以通过增加系统配置或为拓扑提供更多资源来调整参数方法吗?

最佳答案

因此,如果您有一个 Spout 和一个 Bolt,那么最大 Spout Pending 是控制待处理元组数量的最佳方法。 最大 Spout 待处理数量可以无限增加。然而,将其增加到超过一定数量会增加发生超时错误的可能性,并且在最坏的情况下可能无法取得进展。此外,较高的 msp 通常需要 spout 和拓扑的其他组件所需的更多堆。

关于streaming - 最大喷嘴容量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47839872/

相关文章:

apache-spark - 如何检查结构化流中的StreamingQuery性能指标?

apache-storm - Storm 杀死的拓扑未从拓扑列表中删除

apache-storm - 提交拓扑后异常

c# - 如何从 .NET 应用程序启动默认媒体播放器?

scala - 传递给 Spark 的 StreamingContext.fileStream[K, V, F] ("directory"的 Key、Value 和 InputFormat 类型的性质是什么

ffmpeg - 如何使用 netcat 流式传输 H.264?

apache-spark - 为什么spark Streaming从kafka接收数据使用的内存比<executorMemory * executorCount + driverMemory>更多?

Spring Boot uber jar 将类打包到 root 而不是 BOOT-INF/classes

streaming - mp4 视频未在现场播放

使用 MediaPlayer 的 Android 流媒体视频