hadoop - hive 表的单行中有多行

标签 hadoop hive

9,Time :
  Cost : Red pending agreement with MPP TBC
  Scope : This novelty puts strong requirement on navigation system; 

如果我们不按今天的预期修改导航系统,那么这种新颖性的可用性将接近于零(在非SBAS区域)。
10,prabha:
   lakesh
11,chandra

这是我的CSV文件数据。我想将此文件加载到配置单元表中。但是结果应该像第二列的整个数据都在singe列中一样。表示它将与表第二列中的文件中插入的内容相同。我在新行中得到了空值。

最佳答案

由于Hive确实支持结构化数据,因此在Hive表的单行中容易执行多行。

我不确定此示例中使用的数据结构是您真正需要的是什么,但这是如何执行所需的操作:

create table test ( id int, data array<String> );
-- this is required to insert the data into the test table
create table dummy ( it int );
insert into dummy values (1);
insert into test select 10 , array("prabba:","lakes") from dummy;
insert into test select 11, array("chandra") from dummy;

select * from test; 

现在,您可以看到,第二列在同一行中有两行。
0: jdbc:hive2://quickstart:10000/default> select * from test; 
+----------+----------------------+--+
| test.id  |      test.data       |
+----------+----------------------+--+
| 10       | ["prabba:","lakes"]  |
| 11       | ["chandra"]          |
+----------+----------------------+--+

关于hadoop - hive 表的单行中有多行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39792281/

相关文章:

hadoop - Sqoop 使用 Java 从 Mysql 导入到 Hadoop hdfs

hive - Hive 中的 Join 或Where 子句条件

hive - 配置单元中的分区列

hadoop - 在cloudera配置单元设置中在哪里设置配置值?

hadoop - 我正在CDH5.4上使用Hbase 1.0.0和Apache phoenix 4.3.0。当我重新启动Hbase regionserver时关闭

scala - 使用 Spark hadoop API 创建 RDD 以访问 Cassandra DB

hadoop - Spark : Not able to read data from hive tables

hadoop - 无法减去涉及 Hive 查询中别名的两列

hadoop - 在hadoop上使用分隔符以正确的格式创建此文本文件

java - 运行 EMR 时出现 "Error: Could not find or load main class"?