将 Apache NIFI 用于 ETL 过程的效果如何,源为 HDFS,目标为 Oracle DB。 Apache NIFI 与 Pentaho、Datastage 等其他 ETL 工具相比有哪些局限性?
最佳答案
NiFi的主要优势
NiFi的主要优点:
NiFi 的主要限制
NiFi 确实是一个移动数据的工具,您可以丰富单个记录,但通常会提到使用小 t 进行“EtL”。您不想在 NiFi 中做的典型事情是连接两个动态数据源。
对于连接表,通常使用 Spark、Hive 或经典 ETL 替代方案等工具。
对于加入流,经常使用 Flink 和 Spark Streaming 等工具。
结论
NiFi 是一个很棒的工具,您只需要确保将它用于正确的用例。如果需要,您可以使用其他工具来补充它。
特强全披露:我是Cloudera的员工,该公司支持NiFi和Spark、Flink等其他项目。 我之前使用过其他 ETL 工具,但与 NiFi 的程度不同。
关于etl - 用于 ETL 的 Apache NIFI,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45775882/