hadoop - HDFS字符串数据要配置单元表中的时间戳

标签 hadoop hive hdfs

嗨,我在HDFS中有一个字符串'2015-03-26T00:00:00 + 00:00'的数据..如果我想将此数据加载到Hive表中(列作为时间戳)。我无法加载并我得到空值。

如果我将列指定为字符串,我会将数据放入配置单元表
但是,如果我将列指定为时间戳记,那么我将无法加载数据,并且在该列中获取所有NULL值。

例如:HDFS-'2015-03-26T00:00:00 + 00:00'
配置单元表-创建表t1(my_date字符串)
我可以将输出显示为-'2015-03-26T00:00:00 + 00:00'

如果我指定创建表t1(my_date作为时间戳)-我可以看到所有空值

谁可以帮我这个事

最佳答案

文本文件中的时间戳必须使用yyyy-mm-dd hh:mm:ss [.f ...]格式。如果它们采用另一种格式,则将它们声明为适当的类型(INT,FLOAT,STRING等),然后使用UDF将其转换为时间戳。

通过以下链接:

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Types#LanguageManualTypes-Timestamps

关于hadoop - HDFS字符串数据要配置单元表中的时间戳,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29289066/

相关文章:

hadoop - 错误 1200 : Unexpected Symbol?

hadoop - 连接 Hive 动态分区表中的所有分区

xml - 在 Hive 中使用横向 View 时出现异常

mysql - 删除 hive 直线中的重复 header

java - 将JSON文件从本地复制到HDFS

python - 向Hbase插入数据的最快方法是什么?

hadoop - Hive parquet snappy 压缩不起作用

hadoop - 使用 PIG 将文件加载到 Hbase

mysql - 通过 Sqoop 将带有自定义分隔符的 HDFS 文件导出到 Mysql

hadoop - Pig CLI 卡在 ">>"符号提示输入