google-bigquery - BQ 项目中表数量的硬性限制

标签 google-bigquery

我有一些高度可分区的数据,我想将其存储在 BigQuery 中,其中每个分区都有自己的表。我的问题是 BQ 是否支持我需要的 table 数量。

使用我的数据集,我每天会创建大约 2,000 个新表。所有表的有效期均为 390 天(13 个月),因此最终此特定项目中的恒定计数为 ~ 2,000 个表 * 390 天 = ~780,000 个表。

我自己测试了一下,但 BQ 仅支持 max of 10,000每天为每个项目加载作业。

有人有这种 table 计数的经验吗? Google 是否提供任何官方牌 table 限制?

最佳答案

现在有一些项目具有如此数量的不同表。目前对不同表的数量没有硬性上限。

当您考虑使用这么多表的表示时,会想到一些相关的注意事项:

  • 查询(包括引用的 View )当前只能 reference 1000 tables .

  • 使用 table wildcard 时,包含大量表的数据集可能会出现有问题的行为。功能。

  • 您可能过度分片。您可能只想使用更广泛的架构和更少的表,而不是使用大量单独的表。

  • 如果您严重依赖时间间隔作为分片考虑因素,您可能还需要查看 table decorators作为限制数据扫描范围的一种方式。

  • 随着时间的推移,您可能还希望将数据折叠到更少、更大的表中,因为它们会老化且访问频率较低。例如,copy jobs可以将多个源表附加到单个目标表中。

关于google-bigquery - BQ 项目中表数量的硬性限制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30462175/

相关文章:

Firebase Analytics 空用户 ID

google-bigquery - BigQuery 字段名称 _PARTITIONDATE 或 _PARTITIONTIME 无效

sql - Google Big Query 查询汉字(utf-8)

sql - 如何计算第 20 个百分位数和第 80 个百分位数之间的平均值?

python - BigQuery : Unexpected behaviour using bigquery job when writing query result

sql - 有没有办法使用 BigQuery 的 DAYOFWEEK 但以星期一为第一天?

python-3.x - 在 Bigquery 中为多个 CSV 文件自动创建表

google-bigquery - bigquery标准sql错误,时间戳无效

python - 从 python 上传到 BigQuery 时,某些行出现 ASCII 0 错误

google-bigquery - 如何提高分区+集群表查询的数据量?