arrays - 数组与 Hive 相交

标签 arrays apache hive intersect

我在 Hive 中有两个字符串数组,例如

{'value1','value2','value3'}
{'value1', 'value2'}

我想合并没有重复的数组,结果:
{'value1','value2','value3'}

我如何在 hive 中做到这一点?

最佳答案

native 解决方案可能是:

SELECT id, collect_set(item)
FROM table
LATERAL VIEW explode(list) lTable AS item
GROUP BY id;

首先用横向 View 爆炸,然后用collect_set分组并删除重复项。

关于arrays - 数组与 Hive 相交,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21578477/

相关文章:

javascript - 我有两个包含其他数组的数组。如何将 array1 中的每个嵌套数组与 array2 中的对应数组进行比较?

hadoop - 在 Hadoop Hive 中计数

hadoop - 将微策略连接到 Hive

apache - 配置错误页面以显示 modsecurity 的日志

wordpress - 使用 .htaccess 将 WordPress 上传文件夹重定向到 s3 存储桶

hadoop - hive 分组者包含重复结果

python - 如何在 python 中从 3 个数组创建颜色映射

Java编写png文件使一切透明

python - 计算单词数组中相同的连续字母

java - 从 Apache 机器上的 Tomcat 服务器检索文件