csv - 为 Impala 上传 CSV

标签 csv hadoop hue impala

我正在尝试为 Impala 上传 HDFS 上的 csv 文件,但失败了很多次。不确定这里有什么问题,因为我已经按照指南进行操作。而且 csv 也在 HDFS 上。

 CREATE EXTERNAL TABLE gc_imp 
                 (
                  asd INT,
                  full_name STRING,
                  sd_fd_date STRING,
                  ret INT,
                  ftyu INT,
                  qwerINT
                  ) 
ROW FORMAT DELIMITED FIELDS TERMINATED BY','
LOCATION '/user/hadoop/Gc_4';

我遇到的错误。我正在为此使用 Hue。

> TExecuteStatementResp(status=TStatus(errorCode=None,
> errorMessage='MetaException: hdfs://nameservice1/user/hadoop/Gc_4 is
> not a directory or unable to create one', sqlState='HY000',
> infoMessages=None, statusCode=3), operationHandle=None)

任何线索。

最佳答案

/user/hadoop/Gc_4 必须是一个目录。所以你需要创建一个目录,比如/user/hadoop/Gc_4。然后你上传你的 Gc_4 到它。所以文件路径是/user/hadoop/Gc_4/Gc_4。之后可以使用LOCATION指定目录路径/user/hadoop/Gc_4

LOCATION 必须是目录。此要求在 Hive 和 Impala 中相同。

关于csv - 为 Impala 上传 CSV,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18394853/

相关文章:

Postgresql:带转义换行符的 CSV 导出

scala - 将 csv 转换为 RDD

javascript - Node.js将json数组对象插入mysql表

php - 如何设置逗号分隔符将每个单元格从 php 导出到 csv

hadoop - OOzie 定期终止工作

hadoop - 使用 Pig 在 HBase 中为列族添加可变数量的列

java - 使用Java从FTP下载文件到本地导致文件不可读-编码问题

hadoop - 禁用动态映射在ElasticSearch中不起作用

hadoop - 性能 : Pig vs Hive

sql - 当我在同一列中具有不同格式的值时,如何获得相同的日期列值