在处理 Google Analytics Premium 数据期间,对 Dataflow 中的数据应用正则表达式时,我遇到了以下问题:
将正则表达式:.*xxx yyy.*
应用于 BigQuery GUI 中包含字符串:xxx yyy
的字段,未返回 true
,虽然它应该有。
我仔细检查了我的 Dataflow 代码和 BigQuery 数据,但无法立即找到问题。
最佳答案
该问题与数据在 BigQuery GUI 中的表示方式有关。使用 BigQuery 命令行工具 (bq query
) 运行完全相同的查询时,结果显示存储的实际数据不是 xxx yyy
但是 xxx yyy
(包含两个而不是一个空格),因此在遇到类似问题时仔细检查那里的数据可能会很有用。
经过一些额外的挖掘,我发现 this issue在 Google 问题跟踪器上。您可以通过加注星标来了解其最新状态。
关于google-bigquery - 当数据实际包含多个空格时,BigQuery GUI 仅显示 1 个空格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45371865/