oracle - Sqoop导入作业报错org.kitesdk.data.ValidationException for Oracle

标签 oracle hadoop ojdbc sqoop

Oracle 11g 的 Sqoop 导入作业因错误而失败

ERROR sqoop.Sqoop: Got exception running Sqoop: org.kitesdk.data.ValidationException: Dataset name 81fdfb8245ab4898a719d4dda39e23f9_C46010.HISTCONTACT is not alphanumeric (plus '_')

完整的命令如下:

$ sqoop job --create ingest_amsp_histcontact -- import --connect "jdbc:oracle:thin:@<IP>:<PORT>/<SID>" --username "c46010" -P --table C46010.HISTCONTACT --check-column ITEM_SEQ --target-dir /tmp/junk/amsp.histcontact -as-parquetfile -m 1 --incremental append

$ sqoop job --exec ingest_amsp_histcontact

这是 Parquet 格式的增量导入。令人惊讶的是,如果我使用其他格式(如 --as-textfile),它会工作得很好。

这与 Sqoop job fails with KiteSDK validation error for Oracle import 的问题类似

但我用过 ojdbc6 并切换到 ojdbc7 也不行。

Sqoop 版本:1.4.7

甲骨文版本:11g

谢谢, 汤田

最佳答案

我知道有点晚了,但我遇到了同样的问题,我通过省略 parquet 文件选项解决了它。

尝试在没有

的情况下运行作业
-as-parquetfile

关于oracle - Sqoop导入作业报错org.kitesdk.data.ValidationException for Oracle,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49841889/

相关文章:

hadoop - hadoop是大数据空间中唯一的框架吗?

java - 如何使用 Oracle UCP 在运行时为 Tomcat 数据源添加用户名和密码

java - Oracle AQ java实现入队/出队

mysql - 包含列表中所有项目的 SQL 查询记录

sql - 在线运行oracle sql代码

mysql - "Repeatable read"与乐观

hadoop - Apache Zeppelin 能否在一段时间后自动关闭其 SparkContext 并重新打开它?

maven - 无法使用 mvn 编译 elephant-bird

java - 如何在 build.gradle 文件中添加 OJDBC6.jar?

oracle - 使用 Oracle 的 utl_smtp 进行调试