我正在尝试在 hive 上使用regexp_extract。
我有性质不同的数据,例如:a2=new something
a1=asdasdsad;a2=old something;a3=asadasdsadsa
a2=Some place;alksndklsand;a1=asdklsad
现在,我只需要提取a2数据。
分号表示a2数据的结尾,但可能并非在每种情况下都存在。
我一直在尝试用';'修饰到列,然后运行regexp_extract来提取“a2 =“和第一个”;“之间的数据(添加“;”以使逻辑与所有情况兼容):regexp_extract(concat(other_data,';'),'(.*)a2=?(.*?);.*',2)
但这根本不起作用。
有人可以为此建议一个更好的正则表达式吗?
谢谢。
最佳答案
关于regex - 配置单元regexp_extract数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28337821/