hadoop - Talend 和 Apache Spark?

标签 hadoop apache-spark etl talend data-integration

我对 Talend 和 Apache Spark 在大数据生态系统中的位置感到困惑,因为 Apache Spark 和 Talend 都可以用于 ETL。

谁能举个例子解释一下?

最佳答案

Talend 是一种基于工具的大数据方法,支持所有具有内置组件的大数据应用程序。 spark 是基于代码的方法,您需要为用例编写代码。

关于hadoop - Talend 和 Apache Spark?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40371279/

相关文章:

java - Hadoop Mapreduce 作业卡在 map 上 100% 减少 51%

java - 使用 Hive UDF 计算加权因子

scala - 将 foreach 变量传递给 Spark sql 以在 Spark 中计算总和

amazon-web-services - 使用本地机器从 s3 读取数据 - pyspark

sql-server - 删除 vs 回滚策略 - ETL 负载

sql-server - 如何在数据流任务 SSIS 中获取源文件行数?

hadoop - 使用 copyToLocal 从 HDFS 复制的路径

python - 如何使用python读取hadoop映射文件?

java - 让 Spark、Java 和 MongoDB 协同工作

database - ETL(数据库到数据库)如何适应 SOA?