c - 哪个更有效,循环或只是定期添加

标签 c performance for-loop

我正在开发一个 c 应用程序,它从 mysql 表中读取数据,对其进行处理,然后将其插入到 oracle 数据库中的 100 个不同的表中。问题是人们非常关注应用程序的性能。在我提到的 mysql 表中,有 4,800,000,其中有 92 列。 90 的主题只是整数。因此,在我的应用程序中,对于 4,800,000 的每个条目,我正在运行一个 for 循环,如下所示。

    for (col = 1; col < 92; col++) {
        if (row[col] != NULL) {
            sum += strtol(row[col], NULL, 10);
        } else
            sum = sum + 0;
        if (col == 14) {
            p1_2weeks = sum;
        } else if (col == 31) {
            p2_1month = sum;
        } else if (col == 90) {
            p3_2month = sum;
        }
    }

因此,由于这运行了很多次迭代,我相信我有可能通过使用常规加法来减少所花费的时间。

 p1_2weeks = strtol(row[1], NULL, 10) +
             strtol(row[2], NULL, 10) +
             ... +
             strtol(row[14], NULL, 10);
 p2_1months = p1_2weeks +
             strtol(row[15], NULL, 10) + 
             ... +
             strtol(row[31], NULL, 10);
 p3_3months = p2_1months +
             strtol(row[32], NULL, 10) +
             ... +
             strtol(row[91], NULL, 10);

那么有人可以建议哪个更好或其他正确的方法吗。

最佳答案

A for带有显式添加的循环或手动展开不会产生显着差异。大部分时间将花在从 MySQL 读取并将字段转换为字符串,并将结果插入到 Oracle 中。如果程序将 99% 的时间花在数据库代码上(这不会让我感到惊讶),那么优化此循环将是一个有争议的问题。

您可能想要寻找一种不同的方法来从 MySQL 中提取值,该方法不会将整数转换为字符串。

分析会告诉您编译器/选项/cpu/内存/数据集的给定组合的瓶颈在哪里,但要告诉您程序所花费的时间以及等待 Oracle 进程或 MySQL 连接所花费的时间可能会很棘手.耗时是最终的评判者。

请注意,您提出的替代方案在语义上并不等效:在显式添加的序列中,您不测试 NULL领域。如果列不能是 NULL ,您可以删除 if (row[col] != NULL)测试,如果他们可以NULL ,你必须修改添加以添加更多测试,这将使其非常笨拙。此外,正如 seleciii44 所建议的那样,提议的替代方案会生成更大的代码,这也会产生影响。

节点还指出循环非常简单,而添加的顺序很容易出错:很容易出现剪切和粘贴错误以及遗漏索引或重复索引。如果您要添加内容,请使用使索引清晰可见的代码布局。看看我是如何重新格式化你的代码的。

确实你在循环中有拼写错误( p2_1month/p2_1monthsp3_2month/p3_3months )并且加法不计算 p3_3months同样的方式:循环求和 90天,加法总和 91天。但当然,一个季度的天数会有所不同,从 8992天。

另请注意 sum = sum + 0;是一个应该删除的 no 操作,但编译器很可能不会为它生成代码。

如果您担心为每次迭代执行的 14、31 和 90 天的额外测试,您可以使用这个:

    long temp[92];
    for (col = 1; col < 92; col++) {
        if (row[col] != NULL) {
            sum += strtol(row[col], NULL, 10);
        }
        temp[col] = sum;
    }
    p1_2weeks = temp[14];
    p2_1month = temp[31];
    p3_3months = temp[90];

它可能比带有测试的版本更有效,但只有仔细的基准测试才会告诉你,因为如果在存储这些测试时现代处理器的分支预测会最小化成本 91将值转换为本地数组是一个小的额外成本。

顺便问一下,你确定col < 92吗? ?你的循环对待 91列,但你只写了 9092列是整数。

同样,我会首先寻找一种从 MySQL 中提取整数值的方法。

关于c - 哪个更有效,循环或只是定期添加,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34429901/

相关文章:

c - 从c中的tcp套接字读取数据,并卡住数据而不将其复制到用户空间

c - 如何从 printf 输出中删除最后一个空格

c - "using host libthread_db library"不包括 gdb 调试器

c - 关于段错误

javascript - 使用相同的键(日期)组合数组中的对象

python - 如何获取for循环的第一个对象

c# - Linq 查询在本地机器上运行良好,但在服务器上出现 "The connection was reset"错误

python - Python requests.post 这么慢还是我做错了什么?

c - 在包装好的 SSE 花车上翻转标志

Python:For 循环列表给出 IndexError