c - 从文件读取到字符数组,C

标签 c linux optimization valgrind indentation

我在使用这段代码时遇到了一些问题,希望获得一些帮助。该函数从文件读取到动态分配的内存

感谢@JonathanLeffler 的帮助 - 函数缩进工作完美!但又出现了一个问题:使用函数 read_file,它从文件读取到字符数组,然后传递给缩进。

================================================== =========================

//--------------- read_file valgrind validations --------------------
==396== 144 bytes in 1 blocks are definitely lost in loss record 62 of 66 
==396==    at 0x4C2AD10: calloc (in /usr/lib/valgrind/vgpreload_memcheck-amd64-linux.so) 
==396==    by 0x401AC1: read_file (polisher.c:24) 
==396==    by 0x4025CE: test_indent (test_source.c:174) 
==396==    by 0x406BC7: srunner_run (in /tmc/test/test) 
==396==    by 0x402C67: tmc_run_tests (tmc-check.c:134) 
==396==    by 0x402902: main (test_source.c:235) 
==396== 

================================================== ======

char *read_file(const char *filename)
{
    FILE *f = fopen(filename, "r");
    if(!f)
        return NULL;
    int n = 0, c = 0;
    char *a = NULL;
    c = fgetc(f);
    while(c != EOF)
    {
        n++;
        c = fgetc(f);
    }
    freopen(filename, "r", f);
    a = calloc(n + 1, sizeof(char));
    c = fgetc(f);
    n = 0;
    while(c != EOF)
    {
        a[n] = c;
        n++;
        c = fgetc(f);
    }
    a[n] = '\0';
    fclose(f);
    return a;
}

================================================== =================

START_TEST(test_indent)
{
    char *str = read_file("testifile.c");
    if (!str) str = read_file("test/testifile.c");
    if (!str) {
        fail("[M6.01.c] read_file(\"testifile.c\") returned NULL");
    }
    char *res = indent(str, "    ");
    if (!res) {
        free(str);
        free(res);
        fail("[M6.01.c] indent(\"testifile.c\") returned NULL");
    }

    char buf[OUTPUTLEN];
    if (mycompare_new(res, ref61c, buf, OUTPUTLEN)) {
        free(res);
        free(str);
        fail("[M6.01.c] Invalid string from indent(\"testifile.c\"): %s", buf);
    }
    free(str);
    free(res);
    test_complete();
}
END_TEST

最佳答案

您的基本问题是,将单个字符添加到输出缓冲区的代码不会检查是否有多余字符的空间,而且可能没有。您可以通过使用更长的缩进(例如 " /* Look Ma! */ " ,即 16 个字符)来更快地解决该错误。

您目前所在的位置:

        continue;
    } 
    dest[dest_offset++] = c;        
    input++;
}

暴力破解和粗心解决方案增加了:

        continue;
    }
    if (dest_offset >= dest_len)
    {
        printf("XX: DO = %zu, DL = %zu, PL = %zu, LV = %zu\n", dest_offset, dest_len, pad_len, pad_level);
        putchar('@');fflush(0);
        char *ptr = realloc(dest, dest_len * 2);
        if(!ptr)
        {
            free(dest);
            return NULL;
        }
        dest_len *= 2;
        dest = ptr;
    }
    putchar('.');fflush(0);
    dest[dest_offset++] = c;
    input++;
}

哦,我留下了一些最终使用的调试代码。我添加了很多模糊相似的打印代码。循环顶部的断言也有帮助:assert(dest_offset <= dest_len); 。当它发射时,事情变得更加清晰(但我花了一段时间才找出它发射的原因)。我还将换行处理代码中的测试删除为:

        if (dest_offset >= dest_len || (pad_len * pad_level + 1) >= (dest_len - dest_offset))
        {
            printf("YY: DO = %zu, DL = %zu, PL = %zu, LV = %zu\n", dest_offset, dest_len, pad_len, pad_level);
            putchar('@');fflush(0);
            char *ptr = realloc(dest, dest_len * 2);
            if(!ptr)
            {
                free(dest);
                return NULL;
            }
            dest_len *= 2;
            dest = ptr;
        }

但是那个realloc()从未被解雇,这是令人惊讶的事情之一。

我认为你需要一个函数来向输出缓冲区添加一个字符,并且你需要将输出缓冲区控制包装到一个结构中(struct Buffer { char *buffer; size_t maxlen; size_t curlen; }或类似的结构),并且你有一个函数处理(重新)根据需要分配空间。这将避免“暴力和粗心”解决方案的明显重复。您可以将其设为 static inline如果您愿意,可以使用函数 - 编译器可以通过这种方式避免一些开销,而不会影响代码的可读性。还有两个循环的令人讨厌的重复,以将多个缩进添加到缓冲区。当然,最好用另一个函数来处理,但它与“添加一个字符”不同,因为您可以明智地检查是否有足够的空间并重新分配一次。或者编写函数来获取长度和指向非空终止缓冲区的指针(因此单个字符的长度为 1,填充字符串的长度为 pad_len ),并且单个函数可以完成全部工作 - 可能是更好的解决方案。我仍然会将控件打包到一个结构中并让编译器进行优化。

测试main() :

int main(void)
{
    char data[] = "#include <stdio.h>\nint main(void)\n{\nputs(\"Hello World!\\n\");\nreturn 0;\n}\n";
    printf("Before: [[%s]]\n", data);
    fflush(0);
    char *reformatted = indent(data, " /* Look Ma! */ ");
    printf("Indent: -complete-\n");
    fflush(0);
    printf("Source: [[%s]]\n", data);
    fflush(0);
    printf("Target: [[%s]]\n", reformatted);
    free(reformatted);
    return 0;
}

关于c - 从文件读取到字符数组,C,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39102618/

相关文章:

c - 求 C 中潜在无限个整数的平均值

linux - meminfo 中的 DirectMapXX 字段表示什么?

linux - 设备驱动程序代码编译?

linux - 内核模块不构建 .ko 文件

php - 在类中使用超过 1 个内联函数

c - 使用迭代结构的高温和低温阵列

c - 权限位解释

c - 通过宏修改 printf()s 以包含文件和行号信息

c++ - 编译器可以优化多个相同的函数调用吗

java - Python(和Java)中最快的数据打包