csv - 如何将所有字段转义的 Hive 表导出为 CSV

标签 csv hadoop hive

如何以如下格式导出 Hive 表:

"aaa,aaa","bbbbbb","cccccc"

我已经累了:

1) 创建一个基于初始表的临时表 "row format ... escaped by '\042'"

2) 使用 "insert overwrite ... row format ... escape by '\042'"

两者都只转义包含一些特殊字符的字段,如下所示:

"aaa,aaa",bbbbbb,cccccc

我有 Hive 版本 1.1.0-cdh5.5.0

最佳答案

如果您使用的是 Hive 0.14 及更高版本,则可以使用 CSV Serde

您可以像这样指定 serde 属性:

CREATE TABLE my_table(a string, b string, ...)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES (
   "separatorChar" = "\t",
   "quoteChar"     = "'",
   "escapeChar"    = "\\"
)  
STORED AS TEXTFILE;

关于csv - 如何将所有字段转义的 Hive 表导出为 CSV,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37674799/

相关文章:

php - 具有多个标题行的 CSV;使用php导入mysql

python - 如何使用 Scrapy 在一个文件中维护项目的字段名称?

apache-spark - YARN记录.gz格式如何使用命令解压缩

hadoop - 如何将 hbase 表打印到制表符分隔的文本文件

hadoop - Hive 索引 mapreduce 内存错误

java - 写入 HDFS 只能复制到 0 个节点而不是 minReplication (=1)

csv - 如何在 SuiteScript 中从 FileCabinet 加载文件

python - 如果包含某个单词,如何从 csv 中删除一行?

hadoop - 如何安装Kudu?

hadoop管道编译错误