mysql - 跨多个转换定义相同的输出表

标签 mysql etl pentaho kettle pentaho-design-studio

我有 6 个不同的输入数据集。我想对所有 6 个数据集运行 ETL,以便它们都转换为相同的输出表(相同的列和类型)。

我正在使用 Pentaho (Spoon) 来做这件事。

有没有一种方法可以定义一个输出表模式,供 Pentaho 中的所有这些转换使用?我使用 MySQL 作为我的输出数据库。

提前致谢。

最佳答案

听起来您需要“选择值”步骤。将其中一个放在每个数据集路径的最后一跳,并使所有路径的元数据看起来完全相同。然后,您可以将每个“选择值”步骤的输出连接到表输出中。每组中的所有行将按无特定顺序混合在一起。

这可能比看起来更具挑战性。如果任何字段与所有其他数据集中的相应字段不完全相同,Spoon 将抛出错误。您必须找到某种方法使数据集中的所有元数据都相同。

关于mysql - 跨多个转换定义相同的输出表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17054047/

相关文章:

php - 如何检查字符串是否为有效的 DATE、TIME 或 DATETIME

java - 在 Apache NiFi 中读取 UCS-2 LE BOM 编码文件时出现问题

c# - 筛选 Excel 数据 : . 网络与 SSIS

mysql - 使用 Pentaho 将数据从 SQL/Oracle 迁移到 Cassandra

java - 向 Pentaho Kettle 添加新的数据类型

c# - 使用 C# 在 mysql 中插入多行的最佳方法?

php - MySQL表的基本版本控制

Pentaho 未启动,因为它尝试绑定(bind)到已被其自身使用的端口 9092

javascript - Jquery的.load()通过URL中的特定ID从MySQL数据库获取数据

java - Nifi JSON ETL : Custom Transformation Class not found with JoltTransformJSON Processor