hadoop - 将 Hive 表导出到 hdfs 中的 csv/tsv

标签 hadoop hive hdfs

我使用以下代码以 csv/tsv 格式将表从配置单元导出到 hdfs。

INSERT OVERWRITE DIRECTORY '/user/xyz/dem_data/science_data'
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n'
STORED AS TEXTFILE
SELECT *
FROM science_data;

当我在 hdfs 中查看复制的文件时,我看到很多这样的字符

??=%??0nother episod?/aAj%?is   ?a???$of J horse!de9?amA?se0(

我不确定出了什么问题。 我是否需要对此进行某种编码才能获得干净的文本。实际文件有干净的文本。

最佳答案

请使用下面给出的命令尝试使用本地目录:

INSERT OVERWRITE LOCAL DIRECTORY '/home/cloudera/Desktop/xyz/science_data' ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' STORED AS TEXTFILE select * from table_name;

关于hadoop - 将 Hive 表导出到 hdfs 中的 csv/tsv,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52392386/

相关文章:

java - 使用 spring xd 在 Hadoop 中加载数据

hadoop - 无法打开 localhost :8088. 尝试在 Windows10 上安装 Hadoop3

java - 无法在centos R中安装rJava

hadoop - 在配置单元的分区级别添加列

hive - EMR 集群中的外部配置单元元存储问题

hadoop - HDFS阻止问题

hadoop - 如何在 Ubuntu 14.04 上挂载 HDFS

hadoop - 处理错误 : Found interface org. apache.hadoop.mapreduce.TaskAttemptContext,但类是预期的

hadoop - YARN应用程序如何估算所需资源

linux - 如何针对目录中的多个文件执行 Pig 脚本