mysql - sqoop中如何增量导入导入固定行数?

标签 mysql hadoop mapreduce sqoop

我正在自己学习 sqoop,并尝试使用下面提到的代码在本地测试增量导入功能

sqoop import \
--connect jdbc:mysql://localhost/employees \
--username root \
-P \
--query 'select * from employees WHERE $CONDITIONS ORDER BY emp_no LIMIT 1000' \
-m 1 \
--incremental append \
--check-column emp_no \
--target-dir sqoop/import_data/employee_db_import_incremental

上面的脚本导入了前 1000 条记录,现在我想将接下来的 1000 条记录附加到现有数据中。怎么做?

最佳答案

您必须指定需要追加的记录的最后一个值,假设您的最后一个记录是1000,那么您的命令必须如下所示:

sqoop import \
--connect jdbc:mysql://localhost/employees \
--username root \
-P \
--query 'select * from employees WHERE $CONDITIONS ORDER BY emp_no LIMIT 2000' 
\
-m 1 \
--incremental append \
--check-column emp_no \
--last-value 1000
--target-dir sqoop/import_data/employee_db_import_incremental

关于mysql - sqoop中如何增量导入导入固定行数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53273007/

相关文章:

sql - MySQL 是否使用现有索引来创建新索引?

mysql - 使用现有代码使用 MySQL 制作交互式网站的最佳方法是什么?

php - MYSQL:一列上存在多个 "contradicting"条件

amazon-web-services - 在 EC2 上设置 Hadoop 的脚本

hadoop - 分布式缓存不起作用

hadoop - Mapreduce 中可以用combiner 代替reduce 吗?

php - 服务器发送 mysql 已消失错误

hadoop - 将数据从自定义格式上传到 HDFS 集群

hadoop - Hadoop 中 Mappers 的分区输出

java - 在哪里可以看到从 hadoop pig 语句生成的 mapreduce 代码