hadoop - hive 表的单行中有多行

标签 hadoop hive

9,Time :
  Cost : Red pending agreement with MPP TBC
  Scope : This novelty puts strong requirement on navigation system;

如果我们不按今天的预期修改导航系统，那么这种新颖性的可用性将接近于零(在非SBAS区域)。

10,prabha:
   lakesh
11,chandra

这是我的CSV文件数据。我想将此文件加载到配置单元表中。但是结果应该像第二列的整个数据都在singe列中一样。表示它将与表第二列中的文件中插入的内容相同。我在新行中得到了空值。

最佳答案

由于Hive确实支持结构化数据，因此在Hive表的单行中容易执行多行。

我不确定此示例中使用的数据结构是您真正需要的是什么，但这是如何执行所需的操作:

create table test ( id int, data array<String> );
-- this is required to insert the data into the test table
create table dummy ( it int );
insert into dummy values (1);
insert into test select 10 , array("prabba:","lakes") from dummy;
insert into test select 11, array("chandra") from dummy;

select * from test;

现在，您可以看到，第二列在同一行中有两行。

0: jdbc:hive2://quickstart:10000/default> select * from test; 
+----------+----------------------+--+
| test.id  |      test.data       |
+----------+----------------------+--+
| 10       | ["prabba:","lakes"]  |
| 11       | ["chandra"]          |
+----------+----------------------+--+

关于hadoop - hive 表的单行中有多行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39792281/

上一篇：node.js - Docker请求拥有服务器

下一篇：docker - 在多阶段 docker 构建中保留 ENV

hive - Hive 中的 Join 或Where 子句条件

hive - 配置单元中的分区列

hadoop - 在cloudera配置单元设置中在哪里设置配置值？

hadoop - 我正在CDH5.4上使用Hbase 1.0.0和Apache phoenix 4.3.0。当我重新启动Hbase regionserver时关闭

scala - 使用 Spark hadoop API 创建 RDD 以访问 Cassandra DB

hadoop - Spark : Not able to read data from hive tables

hadoop - 无法减去涉及 Hive 查询中别名的两列

hadoop - 在hadoop上使用分隔符以正确的格式创建此文本文件

java - 运行 EMR 时出现 "Error: Could not find or load main class"？