sqoop使用表主键或--split-by <columns>
从 RDBMS 转移到 HDFS,我认为映射器的默认数量是四个。然而,通过 --direct
不使用映射器,传输速度会更快。我的问题是,如果没有使用映射器,那么 Sqoop 如何处理 Hadoop 框架中的传输?
最佳答案
根据 sqoop docs ,
MySQL Direct Connector allows faster import and export to/from MySQL using
mysqldump
andmysqlimport
tools functionality instead of SQL selects and inserts.
通常,它比通过 JDBC 使用多个映射器运行范围查询更快。
关于mysql - --direct 模式如何在 sqoop 中工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44814752/