mysql - 如何使 mysql 在运行查询时比 hadoop 慢?

标签 mysql sql performance hadoop time

我想问一个奇怪的问题。我有一个hadoop项目,我想比较hadoop和mysql的时间性能。我已经制作了 hadoop 应用程序来计算一些东西。如果翻译成 SQL,该应用程序将成为 COUNT 个查询并连接某个表。

首先,我尝试在 SQL 上使用具有大约 100.000 条记录的小表,它查询大约 0.3 或 0.4 秒。所以,我想复制和扩大记录更多的表,看看hadoop比mysql的特性。复制数据可以使 hadoop 比 mysql 更好吗?或者我还能做些什么来证明 hadoop 的时间性能优于 mysql?

最佳答案

为了获得比mysql更好的性能,你的数据量应该非常庞大。例如,如果您的数据是 1GB 。您将并行运行 16 个 Mappers。如果您的数据小于 64 MB,您将使用单个 Mapper,在这种情况下您不会看到性能提升。因此,请确保您的数据足够大以测试性能。

关于mysql - 如何使 mysql 在运行查询时比 hadoop 慢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29697522/

相关文章:

SQL 按子句分组

php - 一次更新两个表

sql - 从临时表更新

android - 如何优化在我的 Android 应用程序中加载大量字符串?

python - 为什么这个 tensorflow 训练需要这么长时间?

optimization - 在shell中以不同的顺序调用uniq和排序

mysql - 如何在MySQL中克服 "Result consisted more than one row"

mysql - 求和列总计(每个重复行数据仅一次)

sql - 如何在SQL中将记录的首字母大写

mysql - 限制两行不同