hadoop - 将 Hive 表导出到 hdfs 中的 csv

标签 hadoop hive

我知道在将表保存到 Hive 中的 csv(或其他文本文件)时,分隔符存在一个已知问题。所以我想知道你们是否可以帮助我解决这个问题。

我有一个现有的表(表 A),我想将它以 csv 格式保存到 hdfs。通过阅读其他回复,我相信我必须首先创建一个外部表(但我不确定整个事情会是什么样子)。

有人能帮忙吗?

最佳答案

在 hive shell 中试试这个:

INSERT OVERWRITE LOCAL DIRECTORY '/path/to/hive/csv' ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' SELECT * FROM hivetablename;

将您的 /path/to/csv 更改为您要存储 csv 文件的位置。 hivetablename 添加到要以 csv 格式存储的配置单元表。

关于hadoop - 将 Hive 表导出到 hdfs 中的 csv,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30224875/

相关文章:

hadoop - Zeppelin 的 Hive 解释器抛出空指针异常

eclipse - Eclipse在Windows上的Hadoop

hadoop - 选择性足以仅考虑HIVE文件中很少的值

authentication - 从远程计算机将文件放在 HDFS 上时如何指定用户名?

hadoop - Amazon Elastic MapReduce 在主节点上完成引导操作,但在核心节点上挂起

scala - 从 scala 中的 map((tuple),(tuple)) 中读取元组的各个元素

hadoop - 忽略/覆盖.pig引导配置

mysql - 不支持的子查询表达式 '' 时尚'' : SubQuery expression refers to Outer query expressions only

where 子句中的 Hive 子查询 (Select * from table 1 where dt > (Select max(dt) from table2) )..请提出替代方案

hadoop - “Hive”多列中的最大列值