mysql - Pentaho PDI(勺子): MySQL table output very slow (~2000 rows/s)

标签 mysql pentaho kettle pdi

与输入(100.000-200.000 行/秒)相比,我的表输出步长非常慢(~2.000 行/秒)。 MySQL 服务器不是问题,使用 native MySQL,例如通过“执行 SQL 脚本”步骤,我得到了 10 万次/秒的结果。我已经尝试(但没有成功)通过以下方式扩展 SQL 选项的常见解决方案:

useServerPrepStmts=false
rewriteBatchedStatements=true
useCompression=true

我还改变了提交大小参数(100、1.000、10.000)并启用了Use batch updates for inserts,但也没有成功。我还可以做些什么?我有大约 10.000.000 行的表,并且 Pentaho 在非常强大的机器上运行,所以这是 Not Acceptable 。

最佳答案

为此,我认为理想的步骤是 MySQL Bulk Loader 步骤,它列在批量加载部分下。连同使用所述

useServerPrepStmts=false
rewriteBatchedStatements=true
useCompression=true

在连接的 JDBC 选项中。 这些useCompression会压缩客户端和MySQL服务器之间的流量 其他两个将形成 INSERT INTO tbl (a,b) VALUES (1,'x'),(2,'y'),(3,'z'); 而不使用单独的插入每个语句。

关于mysql - Pentaho PDI(勺子): MySQL table output very slow (~2000 rows/s),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38660579/

相关文章:

java - Pentaho Web 服务查找无法加载我的 wsdl

linux - 存储在文件系统中的 Pentaho 7.1 报告文件

mysql - Pentaho 表输入到表批量输出

mysql - 大数据并行运行的Pentaho表输入步骤

database - Pentaho 框架尺寸 (17727647) 大于最大长度 (16384000)!

MySQL 命令行客户端

mysql - 在 MySQL 中,如何使用表 A 将两个表与其自身建立一对多关系?

mysql - 提高自 JOIN SQL 查询性能

php - 使用 PDO 从 mysql 数据库检索数据时未找到数据库

css - 我想清除Pentaho的Tomcat服务器的css/html缓存