我想在 group by 子句上采用数组并集。 Hive 没有任何通用方法来聚合数组联合。 除了内置的 hive 函数,还有其他解决方案吗?
示例:
CREATE TABLE base_table
(
day string,
sample_data array<string>
)
SELECT day, ARRAY_UNION(sample_data) FROM
(
SELECT day, sample_data from base_table1
UNION ALL
SELECT day, sample_data from base_table2
)
GROUP BY day
最佳答案
你可以试试 collect_list
或 collect_set
SELECT day, COLLECT_LIST(sample_data) FROM
(
SELECT day, sample_data from base_table1
UNION ALL
SELECT day, sample_data from base_table2
)
GROUP BY day
关于hadoop - 数组联合的聚合函数 [HIVE],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42852155/