arrays - 从配置单元中的非嵌套数据创建嵌套数据

标签 arrays hadoop hive hiveql parquet

有什么方法可以从未嵌套的数据在配置单元中创建嵌套数据

例子: 源表

id zip_code
123 12345
123 23456
123 56789
234 12345
234 99999

看起来像这样

id zipcode
123 12345,23456,56789
234 12345,99999

请注意,一个 id 的邮政编码数量可能会有所不同

最佳答案

select id
     , concat_ws(',',collect_set(zip_code)) as zipcode 
  from your_table 
 group by id

collect_set() 将删除 zip_code 集合中的重复项。如果您需要重复项,请改用 collect_list

关于arrays - 从配置单元中的非嵌套数据创建嵌套数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38270856/

相关文章:

hadoop - 从服务器选项在Spoon中不可见

hive - 是否可以使用 impala 查询包含 DATE 类型列的 Hive 表?

regex - Hive Serde中特定分隔符字符串的正则表达式

hadoop - 我们如何将多个 hql 文件传递​​给 hive/beeline?

python - 有效地居中和叠加 numpy 数组

javascript - 检查两个数组是否相等

java - 如何在 Java 中连接字符串数组

hadoop - Hbase中,ResultScanner和initTableMapperJob扫描有什么区别

arrays - 如何从 Mongoose 数组中获取数据?

mysql - sphinx 和大数据