将增量数据加载到配置单元/黑斑羚表中的最佳方法是什么?
我按照以下步骤操作,但无法成功。
当我依次运行oozie工作流程时,上述方法工作正常。当我同时调用多个作业时,它在加载数据时被挂起。
我无法按顺序运行数据加载。使它更有效的任何帮助,使我可以运行并行作业,这些作业将同时加载数据。
最佳答案
在我们的情况下,每次增量数据都会进入Hive表中的新分区。因此,在第3步(在上述步骤中),我们只需向表中添加一个新分区即可。
如果有多个并行工作流,则如果每个工作流都将数据加载到新分区中,则应该可以正常工作。
关于hadoop - 将数据加载到Hive/Impala,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23117410/