我是 Beam 新手,正在努力寻找许多好的指南和资源来学习最佳实践。
我注意到的一件事是有两种定义管道的方法:
with beam.Pipeline() as p:
# pipeline code in here
或者
p = beam.Pipeline()
# pipeline code in here
result = p.run()
result.wait_until_finish()
是否存在首选每种方法的特定情况?
最佳答案
从代码片段中,我发现主要区别在于您是否关心管道结果。如果您想使用 PipelineResult 来监视管道状态或通过代码取消管道,您可以使用第二种样式。
关于python - 定义 Apache Beam 管道的正确方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56914241/