我知道我们可以创建像这样的Impala表
CREATE EXTERNAL TABLE SCHEMA.TableName LIKE PARQUET
'/rootDir/SecondLevelDir/RawFileThatKnowsDataTypes.parquet'
但是我不确定Impala是否可以从格式未知的文件(最好是文本文件)创建表。因此,换句话说,如果我只是使用put命令将随机文件转储到hadoop中,我可以将Impala DDL包裹在它周围并创建表。谁能告诉我?
最佳答案
如果文件是用换行符分隔的,那么我相信如果为列定界符提供ROW FORMAT子句,它将起作用,因为文本文件是默认格式。只需摆脱LIKE
子句,并为列选择名称和数据类型,如下所示:
CREATE EXTERNAL TABLE SCHEMA.TableName (col1 STRING, col2 INT, col3 FLOAT)
'/rootDir/SecondLevelDir/RawFile'
row format delimited fields terminated by ",";
关于hadoop - Impala最低DDL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34214229/