hadoop - 从 HDFS 导入数据到 Hive 表

标签 hadoop hdfs hive

我的数据在 HDFS 的 data/2011/01/13/0100/file 中,每个文件都包含以制表符分隔的数据,比如名称、ip、url。

我想在 Hive 中创建一个表并从 hdfs 中导入数据,表中应包含时间、名称、ip 和 url。

如何使用 Hive 导入这些? r 数据应该采用其他格式以便我也可以导入时间?

最佳答案

您需要创建用于加载文件的表,然后使用 LOAD DATA 命令将文件加载到 Hive 表中。查看Hive documentation了解要使用的精确语法。

问候, 杰夫

关于hadoop - 从 HDFS 导入数据到 Hive 表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5760960/

相关文章:

hadoop - 统计hdfs中压缩文件的个数

hive - CDH Hive 引发 : Unable to instantiate org. apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient

bash - 如何使用 start_date 变量创建包含一年中所有日期的表?

hadoop - 如何使用Hadoop MapReduce配置对象传递自定义参数?

hadoop - 使用 Hue 在 Hive 中进行多行列注释

scala - 'new HiveContext' 需要 X11 显示? com.trend.iwss.jscan?

hadoop - KMeanClustering中的类未找到异常--Mahout

apache-spark - spark 在 HDFS 上保存和读取 Parquet

apache-kafka - 即使 json 数据包含架构和有效负载字段,kafka 连接 hdfs 接收器连接器也失败

oracle - 在装载表时从Oracle表中卸载Sqoop