hadoop - 使用查询的 Sqoop 导出

标签 hadoop sqoop bigdata

我们正在尝试将数据从 HIVE 表导出到 HANA,能够使用 Sqoop 导出命令中的 --hcatalog 表选项导出数据。

但是在尝试使用带有 where 子句的查询选项加载数据时遇到问题

是否可以在sqoop export命令中使用query选项?

我的示例 scoop 命令如下所示

sqoop export -D sqoop.export.records.per.statement=1 -D mapreduce.map.memory.mb=16384 -D mapreduce.map.java.opts=-Xmx16384m  --connect "jdbc:xxxxxx" --driver "com.sap.db.jdbc.Driver" --username "xxxxx" --password "xxxxxx" --table "hanaschema.table1" --query "select field1,substr(field2,1),field3,field4,from "hadoopschema.table" where field1 = 2017 and field3 = 4" --input-null-string '\\N' --input-null-non-string '\\N' --num-mappers 20 –-validate

感谢您的帮助..

谢谢 斯里尼

最佳答案

不幸的是,Sqoop Export 尚不支持 --query 参数。我们只能将其与 Sqoop 导入命令一起使用。

请引用Export control arguments有关 Sqoop 导出中可用选项的详细信息的部分。

或者将查询的输出复制到另一个表中,然后将该表导出到 HANA 中。

关于hadoop - 使用查询的 Sqoop 导出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45447237/

相关文章:

hadoop - 抽象方法的实现

hadoop - Oozie shell 操作 - 运行 sqoop 命令并需要日志记录详细信息

python - 如何使用mysql数据库作为机器学习的数据集

hadoop - CHD 5.4.0 Map和Reduce的问题

hadoop - 如何在HBase中测试恢复?

c# - 如果进程以编程方式运行(来自 C#),则“没有这样的文件或目录”

java - 即使pom.xml中存在依赖关系,也无法为org.json.simple.parser.ParseException找到类?

java - 如何为我的 Java 应用程序配置远程 Hbase 服务器

mysql - 为什么在从 hive 导出到 mysql 期间,sqoop 在数字列的 NumberFormatException 上失败

hadoop - Apache Sqoop 的网络弹性