go - BigQuery 中的数据库设计

我有一个名为“Acquisition”的主表，其中有多个列将引用其他表(例如:“Source”、“Application”等 - 例如，“Source”将有多个可能的值，这些值将用于多个“Acquisition”表的行)。让我有点困扰的是，“Acquisition”表的行会返回这样的数据:

id > 1 ;值(value) > 23.4 ; source_id > 1 ; application_id > 3 ;platform_id > 1 ; country_id > 1 ;等

您认为还有另一种设计方法可以使其更具可读性/用户友好性吗？

这里是架构代码的摘录:

acquisitionSchema = bigquery.Schema {
    &bigquery.FieldSchema{Name: "id", Required: true, Type: bigquery.StringFieldType},
    &bigquery.FieldSchema{Name: "value", Required: true, Type: bigquery.FloatFieldType},
    &bigquery.FieldSchema{Name: "source_id", Required: true, Type: bigquery.StringFieldType},
    &bigquery.FieldSchema{Name: "application_id", Required: true, Type: bigquery.StringFieldType},
    &bigquery.FieldSchema{Name: "platform_id", Required: true, Type: bigquery.StringFieldType},
    &bigquery.FieldSchema{Name: "country_id", Required: true, Type: bigquery.StringFieldType},
    &bigquery.FieldSchema{Name: "adtype_id", Required: true, Type: bigquery.StringFieldType},
    &bigquery.FieldSchema{Name: "date", Required: true, Type: bigquery.dateFieldType},
    &bigquery.FieldSchema{Name: "download", Required: false, Type: bigquery.IntegerFieldType}   } 

sourceSchema = bigquery.Schema {
    &bigquery.FieldSchema{Name: "id", Required: true, Type: bigquery.StringFieldType},
    &bigquery.FieldSchema{Name: "value", Required: true, Type: bigquery.StringFieldType},
}

我想过直接输入源、平台等的值，但是当我通过 API 从多个源获取数据时，它可能会变得困惑，除非我在代码中进行所有必要的控制。

谢谢!

最佳答案

通常我们做一个RECORD有两列(id,name)

-country
 |id
 |name

这样在我们的查询中，我们可以使用 country.id 来按整数查询，或者使用 country.name 来显示值以便快速检查。

由于现在存储很便宜，我们可以负担得起在每一列中存储文字表示。由于 BQ 在设计上是仅附加的，而且我们通常读取最近的行，如果 name 同时发生变化，那已经包含了新值。使用 LAST_VALUE 函数，我们始终可以选择包含最后一个 name 的最后一条记录。

关于go - BigQuery 中的数据库设计，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42986325/

go - BigQuery 中的数据库设计

上一篇：go - 安装依赖项时如何修复 "go get ./..."？

下一篇：testing - 使用包调用 go test 时的输出差异