mysql - 使用 Hadoop 更新 MySQL

标签 mysql hadoop

我正在使用我的 reducer 将数据输入 MySQL。 我担心的是,在某些情况下,同时为同一个键启动多个 reducer。在这种情况下,数据库可能会被相同的数据更新两次。 有什么方法可以防止这种情况发生吗?

在这种情况下,关闭 SQL 连接中的自动提交模式是否有意义?

最佳答案

您可以更改设置:

mapred.reduce.tasks.speculative.execution

如果是这种情况,这将禁用 reduce 任务的推测执行。

我建议的另一种方法是使用 Sqoop 写入 MySQL:http://archive.cloudera.com/cdh/3/sqoop/SqoopUserGuide.html#_literal_sqoop_export_literal

关于mysql - 使用 Hadoop 更新 MySQL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6024454/

相关文章:

hadoop - FileNotFoundException但文件存在

mysql - 查询关联表的外键

hadoop - 使用Hadoop处理工资单的缺点

hadoop - 将 Spark 添加到 Oozie 共享库

java - 捕获无效 hibernate 连接 URL 错误

hadoop - 在 YARN 上运行 Spark-Submit 但不平衡(只有 1 个节点在工作)

java - 如何获取和查看从HDFS到本地系统的Oracle BLOB(图像)数据?

mysql - 如何在联结表上插入值

php - 为什么这个聚合函数查询给出语法错误?

MySQL 安装程序卡在 "Starting Service"