我正在开发一个 c 应用程序,它从 mysql 表中读取数据,对其进行处理,然后将其插入到 oracle 数据库中的 100 个不同的表中。问题是人们非常关注应用程序的性能。在我提到的 mysql 表中,有 4,800,000,其中有 92 列。 90 的主题只是整数。因此,在我的应用程序中,对于 4,800,000 的每个条目,我正在运行一个 for 循环,如下所示。
for (col = 1; col < 92; col++) {
if (row[col] != NULL) {
sum += strtol(row[col], NULL, 10);
} else
sum = sum + 0;
if (col == 14) {
p1_2weeks = sum;
} else if (col == 31) {
p2_1month = sum;
} else if (col == 90) {
p3_2month = sum;
}
}
因此,由于这运行了很多次迭代,我相信我有可能通过使用常规加法来减少所花费的时间。
p1_2weeks = strtol(row[1], NULL, 10) +
strtol(row[2], NULL, 10) +
... +
strtol(row[14], NULL, 10);
p2_1months = p1_2weeks +
strtol(row[15], NULL, 10) +
... +
strtol(row[31], NULL, 10);
p3_3months = p2_1months +
strtol(row[32], NULL, 10) +
... +
strtol(row[91], NULL, 10);
那么有人可以建议哪个更好或其他正确的方法吗。
最佳答案
A for
带有显式添加的循环或手动展开不会产生显着差异。大部分时间将花在从 MySQL 读取并将字段转换为字符串,并将结果插入到 Oracle 中。如果程序将 99% 的时间花在数据库代码上(这不会让我感到惊讶),那么优化此循环将是一个有争议的问题。
您可能想要寻找一种不同的方法来从 MySQL 中提取值,该方法不会将整数转换为字符串。
分析会告诉您编译器/选项/cpu/内存/数据集的给定组合的瓶颈在哪里,但要告诉您程序所花费的时间以及等待 Oracle 进程或 MySQL 连接所花费的时间可能会很棘手.耗时是最终的评判者。
请注意,您提出的替代方案在语义上并不等效:在显式添加的序列中,您不测试 NULL
领域。如果列不能是 NULL
,您可以删除 if (row[col] != NULL)
测试,如果他们可以NULL
,你必须修改添加以添加更多测试,这将使其非常笨拙。此外,正如 seleciii44 所建议的那样,提议的替代方案会生成更大的代码,这也会产生影响。
节点还指出循环非常简单,而添加的顺序很容易出错:很容易出现剪切和粘贴错误以及遗漏索引或重复索引。如果您要添加内容,请使用使索引清晰可见的代码布局。看看我是如何重新格式化你的代码的。
确实你在循环中有拼写错误( p2_1month
/p2_1months
, p3_2month
/p3_3months
)并且加法不计算 p3_3months
同样的方式:循环求和 90
天,加法总和 91
天。但当然,一个季度的天数会有所不同,从 89
至 92
天。
另请注意 sum = sum + 0;
是一个应该删除的 no 操作,但编译器很可能不会为它生成代码。
如果您担心为每次迭代执行的 14、31 和 90 天的额外测试,您可以使用这个:
long temp[92];
for (col = 1; col < 92; col++) {
if (row[col] != NULL) {
sum += strtol(row[col], NULL, 10);
}
temp[col] = sum;
}
p1_2weeks = temp[14];
p2_1month = temp[31];
p3_3months = temp[90];
它可能比带有测试的版本更有效,但只有仔细的基准测试才会告诉你,因为如果在存储这些测试时现代处理器的分支预测会最小化成本 91
将值转换为本地数组是一个小的额外成本。
顺便问一下,你确定col < 92
吗? ?你的循环对待 91
列,但你只写了 90
的 92
列是整数。
同样,我会首先寻找一种从 MySQL 中提取整数值的方法。
关于c - 哪个更有效,循环或只是定期添加,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34429901/