c - 如何有效地从 C 文件中检索数据

标签 c performance file-io

我有一个程序应该从文本文件中检索(启动时)数据。该文件可能会变得很大,我想知道如何加快该过程并评估其当前性能。 用于获取数据的代码如下:

void startUpBillsLoading(Bill *Bills)
{
    FILE *BillsDb = 0, *WorkersDb = 0, *PaymentDb = 0;
    BillsDb = fopen("data/bills.db", "r");
    WorkersDb = fopen("data/workers.db", "r");
    PaymentDb = fopen ("data/payments.db", "r");
    char *Buffer = malloc (512);

    if (BillsDb && WorkersDb && PaymentsDb)
    {
        int i = 0, j = 0;

        while (fscanf (BillsDb, "%d;%[^;];%[^;];%[^;];%[^;];%d/%d/%d;%d/%d/%d;%d;%f;%f\n",
                &Bills[i].Id,
                Bills[i].CompanyName,
                Bills[i].ClientName,
                Bills[i].DepartureAddress,
                Bills[i].ShippingAddress,
                &Bills[i].Creation.Day,
                &Bills[i].Creation.Month,
                &Bills[i].Creation.Year,
                &Bills[i].Payment.Day,
                &Bills[i].Payment.Month,
                &Bills[i].Payment.Year,
                &Bills[i].NumWorkers,
                &Bills[i].TotalHT,
                &Bills[i].Charges) == 14)
        {
            Bills[i].Workers = 
                malloc (sizeof(Employee)*Bills[i].NumWorkers);

            fscanf (PaymentDb, "%d;%d;%[^;];%[^;];%[^\n]\n",
                    &Bills[i].Id,
                    &Bills[i].PaymentDetails.Method,
                    Bills[i].PaymentDetails.CheckNumber,
                    Bills[i].PaymentDetails.VirementNumber,
                    Bills[i].PaymentDetails.BankName);

            LatestBillId++;
            i++;
        }

        i = 0;
        while (fscanf (WorkersDb, "%d;%[^;];%[^;];%f\n",
                    &Bills[i].Id,   
                    Bills[i].Workers[j].Surname,
                    Bills[i].Workers[j].Name,
                    &Bills[i].Workers[j].Salary) == 4)
        {
            for (int j = 1; j <= Bills[i].NumWorkers-1; j++)
            {
                fscanf (WorkersDb, "%d;%[^;];%[^;];%f\n",
                                &Bills[i].Id,   
                                Bills[i].Workers[j].Surname,
                                Bills[i].Workers[j].Name,
                                &Bills[i].Workers[j].Salary);
            }
            i++;
        }

        fclose(BillsDb);
        fclose(WorkersDb);
        fclose(PaymentDb);
    }
    else
        printf ("\t\t\tImpossible d'acceder aux factures !\n");

    free (Buffer);
}

我已经使用 time.h 库来测量检索所有必需数据所花费的时间。 Bill 的数据分为 3 个文件:bills.db、workers.db 和 payments.db。 bills.dbpayments.db 中的每个文件行代表一个完整的账单,而在 workers.db 中需要代表的行数账单是可变的,取决于与账单相关的员工数量。

我以这种方式创建了这 3 个文件:

  • bills.dbpayments.db 有 118087 行(因此有很多账单)
  • 每个账单(任意)设置为有 4 个 worker ,因此 workers.db 文件有 118087*4 = 472348 行。

此函数运行完全所需的时间约为 0.9 秒。 这次有多好(或多坏)以及如何改进?

最佳答案

您必须阅读的内容很少。第一个是渐近时间复杂度和渐近空间复杂度,第二个是大 O 表示法。大 O 表示法说明程序的运行情况。对于您提供的代码,大 O 复杂度约为 O(n^2)。因此,最大限制很好,因为它与快速排序相同,但由于您使用的数据很长,因此加载时间总是会增加您的运行时间。如果您想改进,请尝试最小化数据的长度从文件中读取最少的数据。因为如果 n 的值增加,时间将迅速增加。你可以阅读 asymptotic notationBig O notation从这里开始

关于c - 如何有效地从 C 文件中检索数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45555327/

相关文章:

java - 为了循环效率

c# - FileSystemWatcher 失败,创建了 1000 个文件

c - fflush 是如何工作的?

c - 如何malloc、calloc、realloc一个二维指针结构?

java - 谷歌地图在离线模式下的新版本电池消耗

performance - 优化MLT Elasticsearch查询

c - 关于将 char[] 传递给 isdigit()

c - 按位或与逻辑或

c - 在函数中打开二进制文件?请参阅代码 :

c - 无意中使用 ZwOpenFile