我在 Hive 中有两个字符串数组,例如
{'value1','value2','value3'}
{'value1', 'value2'}
我想合并没有重复的数组,结果:
{'value1','value2','value3'}
我如何在 hive 中做到这一点?
最佳答案
native 解决方案可能是:
SELECT id, collect_set(item)
FROM table
LATERAL VIEW explode(list) lTable AS item
GROUP BY id;
首先用横向 View 爆炸,然后用collect_set分组并删除重复项。
关于arrays - 数组与 Hive 相交,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21578477/