sql - 正则表达式和配置单元

标签 sql regex hadoop hive

我正在尝试使用org.apache.hadoop.hive.serde2.RegexSerDe创建一个配置单元外部表来分析注释。示例行是:

0   @chef/maintain fix the problem  2017-05-25 20:34:45  1  2017-05-25 20:34:27 0

6   ^ trailing comma is trolling you    2017-05-23 23:08:46 0   2017-05-24 04:40:42 1

这是我的正则表达式:
("input.regex" = “(d{1,5}\\s\\w+\\s\\.{19}\\.{1}\\s\\.{1}");

我得到一个空表,无法计算正则表达式。

表定义:

订购1,2,3,4 ...
评论@ chef / maintain解决问题
comment_time 2017-05-25 20:34:45
合并1或0
merged_time 2017-05-25 20:34:27
已解决1或0

有人可以帮忙吗?

最佳答案

试试这个正则表达式

(\\d)\\s+([^\\d{4}]*)\\s(\\d{4}-\\d{2}-\\d{2}\\s\\d{2}:\\d{2}:\\d{2})\\s+(\\d)\\s+(\\d{4}-\\d{2}-\\d{2}\\s\\d{2}:\\d{2}:\\d{2})\\s(\\d)

关于sql - 正则表达式和配置单元,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46106242/

相关文章:

regex - IIS URL 重写,URL 中的条件更改

hadoop - 如何在满足特定条件时逐行迭代配置单元表并计算指标?

r - centos无法安装rhdfs

sql - 有没有办法根据 Max(date) 在 postgres 中获取组的第一行

mysql - MySQL 中何时使用单引号、双引号和反引号

php - pg_connect 或 PDO

javascript - 正则表达式 [ ] 到底做什么?

mysql - 如何从数据库列中分解用户 ID?

javascript - Javascript 中的正则表达式组

scala - 带数组的 Spark 塞