hadoop - Impala最低DDL

标签 hadoop cloudera hadoop2 cloudera-cdh impala

我知道我们可以创建像这样的Impala表

CREATE EXTERNAL TABLE SCHEMA.TableName LIKE PARQUET
'/rootDir/SecondLevelDir/RawFileThatKnowsDataTypes.parquet'

但是我不确定Impala是否可以从格式未知的文件(最好是文本文件)创建表。因此,换句话说,如果我只是使用put命令将随机文件转储到hadoop中,我可以将Impala DDL包裹在它周围并创建表。谁能告诉我?

最佳答案

如果文件是用换行符分隔的,那么我相信如果为列定界符提供ROW FORMAT子句,它将起作用,因为文本文件是默认格式。只需摆脱LIKE子句,并为列选择名称和数据类型,如下所示:

CREATE EXTERNAL TABLE SCHEMA.TableName (col1 STRING, col2 INT, col3 FLOAT)
'/rootDir/SecondLevelDir/RawFile'
row format delimited fields terminated by ",";

关于hadoop - Impala最低DDL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34214229/

相关文章:

java - HBase 的 Bytes.toBytes - 它的输出是有序的吗?

hadoop - 亚马逊弹性 map 减少 : Listing job flows in command line tools Issue?

hadoop - mapreduce应用程序和yarn应用程序之间有什么区别?

hadoop - 使用sqoop从RDBMS增量导入数据到配置单元/hadoop

python - Hadoop streaming with private python 解释器

database - 凤凰加入操作不适用于 hbase

hadoop - 有没有办法从目录中的所有 HDFS 文件中获取第一行?

hadoop distcp异常无法重命名tmp文件

hadoop - Cloudera 可视化工具

hadoop - 未指定行号时使用 MapReduce 进行矩阵转置