hadoop - 从RDBMS批量导入到Hadoop

标签 hadoop rdbms sqoop

我在Oracle中存储了1 PB的数据,我想将这些数据放入hadoop中。建议采取什么方法?建议使用Sqoop吗?如果不是,那么应该使用什么方法或工具来进行这种大负载

最佳答案

Sqoop是一个不错的选择,尽管我不确定它是否支持Oracle的批量操作(与JDBC select查询相对)。

问题在于,Sqoop将尝试通过单个操作(尽管可能具有多个进程)来完成此操作,并且在具有如此大量的数据的情况下,您可能希望进行更多的零碎和容错的导入。

之后您打算如何处理这些数据?您想以什么格式存储数据? Sqoop还有其他优点,例如直接导入到Hive表中。

关于hadoop - 从RDBMS批量导入到Hadoop,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24359765/

相关文章:

hadoop - 使用--query参数导入sqoop

hadoop - 使用Flume在HDFS中获取Twitter数据时出现问题

hadoop jar命令执行

mysql - 我怎样才能处理这个一对多的关系,这个约束在一个 note ON 字段上?

indexing - 如何计算色谱柱选择性

hadoop - 如何使用自由格式查询选项执行Sqoop导入验证

shell - shell 脚本中的 SQOOP 导出失败

hadoop - HDFS 错误 + 不完整的 HDFS URI,没有主机 : hdfs://l27. 0.0.1:9000

hadoop - 如何选择Hadoop工具以获得更快的性能

java - 使用 JDBC 将 RDBMS 转换为 OOP,将 SQL 转换为 Java