我正在尝试sqoop执行从Teradata DB到Hive的增量导入。下面是查询:
sqoop import --connect jdbc:teradata://xxx.xxx.x.xx/DATABASE=DBN --driver com.teradata.jdbc.TeraDriver --username userN --password pass --query "SELECT alias.colA, alias.call_date, alias.colB, alias.colC FROM tableName alias where \$CONDITIONS" --target-dir /apps/hive/warehouse/staging.db/tableName -m 26 --check-column call_date --incremental append --split-by alias.colA --last-value '2016-02-01'
列call_date为DATE类型,值格式为“YYYY-MM-DD”。
当我将
'append'
用作--incremental
时,一切正常。但是,当我将'lastmodified'
放入时,会引发以下错误:ERROR util.SqlTypeMap: It seems like you are looking up a column that does not
ERROR util.SqlTypeMap: exist in the table. Please ensure that you've specified
ERROR util.SqlTypeMap: correct column names in Sqoop options.
ERROR tool.ImportTool: Imported Failed: column not found: call_date
我在
sqoop 1.4.4.2.1
上使用HDP 2.1
当Teradata DB是14.10
时任何指针都会有所帮助。
最佳答案
我认为,在查询的情况下,您可以在查询本身中执行最后的值检查,有些人会这样想"SELECT alias.colA, alias.call_date, alias.colB, alias.colC FROM tableName alias where call_date >'2016-02-01' and \$CONDITIONS"
。
引用(请参阅Hive中的增量更新数据>1。提取数据。)
https://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.3.0/bk_dataintegration/content/incrementally-updating-hive-table-with-sqoop-and-ext-table.html
关于hadoop - 增量 “lastmodified”在sqoop中不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38970733/