hadoop - 我如何使用列名从数据框中访问数据

标签 hadoop sqoop

我有一个oracle表,其中存储了xml数据(xmlType)。我正在尝试使用以下命令将其压缩到hdfs。 xml字段在hdfs文件中显示为null。

sqoop import --connect jdbc:oracle:thin:@DBconnString 
             --username uname --password pwd 
             --delete-target-dir 
             --table sample 
             --map-column-java column1=String

谁能暗示我在做什么错?

最佳答案

这是一个限制,不支持xmlType。

https://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html#_supported_data_types

这里有一个解决方法https://issues.apache.org/jira/browse/SQOOP-2749,它实际上是将xmlType转换为clob,然后使用以下选项将其映射为字符串

--map-column-java "XMLRECORD=String"

关于hadoop - 我如何使用列名从数据框中访问数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42399854/

相关文章:

Hadoop block 管理

hadoop - hadoop-env.sh什么时候会在hadoop中执行

oracle - 鱿鱼进口 Parquet 尺寸

mysql - 导出 sqoop 与 --input-lines-termerated-by =":"不起作用

postgresql - Pig oozie工作流程不执行UDF

hadoop - 在HDFS中复制文件时如何修复 'URISyntaxException'

hadoop - 在 Hive 上交叉应用 SQL Server 查询

oracle - 从Oracle导入sqoop失败

hadoop - oozie - sqoop $SQOOP_CONF_DIR 尚未在环境中设置

hadoop - Apache Sqoop增量导入