我正在寻找 Hive 中的内置字符串拆分函数?例如如果字符串是:
A|B|C|D|E
然后我想要一个像这样的函数:
array<string> split(string input, char delimiter)
这样我就可以回来了:
[A,B,C,D,E]
Hive中是否存在这种内置的split函数。
我只能看到 regexp_extract
和 regexp_replace
。我很想看到 indexOf()
和 split()
字符串函数。
最佳答案
确实存在基于正则表达式的拆分函数。未列出in the tutorial , 但它列在 the language manual on the wiki 上:
split(string str, string pat)
Split str around pat (pat is a regular expression)
在您的情况下,分隔符“|
”作为正则表达式具有特殊含义,因此应将其称为“\\|
”。
关于hadoop - Hive 有字符串拆分功能吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4065999/