hadoop - 在具有困惑数据且未修改时间列的表上以sqoop增量导入

标签 hadoop import hive sybase sqoop

假设我有一张表Customer:

CustomerID  CustomerName  CustomerBill
7           John          100
2           Bill          500
4           Mark          200

这里,CustomerID是主键,但是记录没有特定的顺序。数据库的相应表中没有修改的时间列。先前的条目也可以更改。如何对数据进行增量导入?

我正在使用的数据库是Sybase,并将其导入到Hive。

最佳答案

Records are in no particular order.



append 模式无法使用。

There is no modified time column in the corresponding table in the database.



lastmodified 模式无法使用。

Sqoop做任何特殊的事情。它需要递增ID或更新timstamp才能进行SQL查询以获取,只有插入/更新了。

关于hadoop - 在具有困惑数据且未修改时间列的表上以sqoop增量导入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42808133/

相关文章:

java - hadoop 和 yarn 的 Maven 依赖项

django - 连接 django-rq 时出错 : ImportError: cannot import name get_failed_queue

hadoop - 在 Hive 中使用 Join 更新查询

hadoop - HDFS小文件设计

hadoop - 压缩RC表 hive

java - 如何在 Java 项目中设置 extJWNL?

hadoop - 配置单元插入覆盖所有分区

sql - HIVE-QL 中的 LEAD 函数语法

sql-server - 使用jtds驱动程序从hdfs到SQL Server 2005的Sqoop导出失败

python-3.x - 在 python3 中使用 importlib 动态导入时出错