snowflake-cloud-data-platform - Snowflake 上的依赖 SnowPipe

标签 snowflake-cloud-data-platform

在 Snowflake 中,有一个名为 Snowpipe 的概念,它会自动将来自不同数据源的数据加载到配置的表中。

我们正在尝试通过 Snowpipe 加载到雪花中时进行归一化。

Table A: 
Id & EmployerName

Table B:
Id, Employeename & EmployerID

文件中的值

Name, EmployerName
Raj, Google
Kumar, Microsoft

我们无法在同一个管道中填充表 A 和表 B,因为该管道只有一个复制语句。

是否有依赖 PIPE 等概念先加载查找表并从示例文件加载主表?

注意:

  • 如果我们有两个管道,我们将无法指定依赖关系。

最佳答案

只要源数据在云提供商的 blob 存储位置可用,就应该使用 Snowpipe 将数据加载到表中。您不能在 Snowpipes 之间设置依赖关系,这无论如何都会增加管道的延迟。

最好的办法是设置两个 Snowpipes,以便在数据到达 blob 存储时立即加载两个表,然后使用 Snowflake tasks处理依赖关系和业务逻辑。

关于snowflake-cloud-data-platform - Snowflake 上的依赖 SnowPipe,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59316585/

相关文章:

sql - 雪花查询引擎对几种带查询条件的策略

snowflake-cloud-data-platform - 为什么雪花不使用我的物化 View

python - 计算字段中单词/字符的出现次数

sql - 如何在雪花中编写相关子查询

snowflake-cloud-data-platform - 一次删除多个表

sql - 无法在 Snowflake 中具有混合数据类型的字段上内部连接两个简单的 CTE

arrays - 如何取消嵌套 JSON 数据对象并使用 Snowflake 创建简化的 JSON?

sql - 如何将嵌套的 json 键/值对展平为单个值数组?

amazon-s3 - 当我加载 S3 上的 CSV 文件时,如何自动推断它们的架构?

snowflake-cloud-data-platform - 多个 CASE when 语句