我们的解析器现在遇到一些问题。我们按原样保存所有日志,而不进行解析。
我需要搜索我们所有的日常日志,并找出我们获得 IP 地址和端口的次数。
例如:123.123.123.231:45771
问题在于,一个请求到另一个请求的位数不同(IP 地址和端口号)。
我应该如何编写查询以便能够以这种方式过滤它?
最佳答案
我会使用正则表达式 (RegEx) 来查找 IP 地址。看看这些例子:
- http://www.regular-expressions.info/examples.html
- https://www.safaribooksonline.com/library/view/regular-expressions-cookbook/9780596802837/ch07s16.html
我自己没有使用过 Google Bigquery,我鼓励您看看这个问题 BigQuery REGEXP_MATCH and accents : boundary wildcard fails?寻求更多帮助。
关于regex - 搜索具有端口模式的 IP,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28526679/