我有一个包含文本列(详细信息)的 postgress 表。我已在 Hive 中将 detail 声明为 STRING。当我尝试从 SQOOP 或 SPark 导入它时,它已成功导入。但是,我缺少详细信息列中可用的大量数据,并且在配置单元表中创建了许多空行。
谁能帮我解决这个问题?
例如:详细列有以下数据
line1 sdhfdsf dsfdsdfdsf dsfs
line2 jbdfv df ffdkjbfd
jbdsjbfds dsfsdfb dsfds
dfds dsfdsfds dsfdsdskjnfds
sdjfbdsfdsdsfds
只有“line1 sdhfdsf dsfdsdfdsf dsfs”被导入到配置单元表中。
我可以看到剩余行的空行。
最佳答案
Hive 不支持文本文件格式中的多行。您必须将此数据加载到二进制文件 Avro 或 Parquet 中,以保留换行符。如果您不需要保留它们,那么您可以使用 hive-drop-import-delims 剥离它们
关于hadoop - 如何将 Postgres "Text"数据类型加载到 HIVE 中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35519973/