c - 在 C 语言的循环中重复在堆栈上创建缓冲区是不好的做法吗?

标签 c performance while-loop stack buffer

这篇文章的标题与我搜索的相关内容非常相似。我遇到的每个结果都与缓冲区溢出有关,但这不是我想要的。

我的函数在我之前填充的不同结构中迭代每个文件名。每个文件名的大小各不相同,从非常小到很大。

以前我的函数要做的是创建缓冲区,大小为 2048 字节。然后进入循环。 在循环的每次迭代期间,缓冲区都会填充目标目录的路径,以及连接到其末尾的目录中的当前文件名。 使用缓冲区内的新路径,我执行一些相当小的文件操作。 这种情况会发生,直到达到结构中的最终文件名为止。

但问题是并非每个完整路径都是 2048 字节。有些可能甚至不到这个大小的三分之一。

重新审视这个函数,我将缓冲区的创建移到了循环内,循环的每次迭代都会创建大小为 n 的缓冲区,其中 n 是目标目录的长度+目录中当前文件名的长度

我想知道这是否可以被视为不好的做法或其他什么。即使有时 2/3 的缓冲区未使用,我是否最好提前创建缓冲区并始终为其设定大小?或者只创建正好符合我需要的大小的缓冲区是一个更好的主意吗?

我希望我已经提供了足够的信息...提前致谢!

这是有问题的函数。

int verifyFiles(DIR *dp, const char *pathroot){
    struct dirent *dir;
    struct stat pathstat;
    //char path[2048];
    int status = 0;

    while((dir = readdir(dp)) != NULL){
        if(!strncmp(dir->d_name, ".", 1))
            continue;

        size_t len = strlen(pathroot) + strlen(dir->d_name) + 2;
        char path[len];
        snprintf(path, sizeof(path), "%s/%s", pathroot, dir->d_name);
        
        // verify shebang is present on the first line of path's contents.
        if(!shebangPresent(path)){
            status = -1;
            break;
        }

        // verify path belongs to the user.
        stat(path, &pathstat);
        if(pathstat.st_uid != getuid()){
            status = -1;
            break;
        }
    }

    return status;
}

最佳答案

拥有这样的固定缓冲区绝对没有问题。不要担心这样的小细节。该函数将分配 2kB 内存,完成其工作,然后释放它。如果这是一个问题,那么您遇到的问题比这段代码更大。

我只会在递归函数的情况下担心这些事情。就像如果你有这样的事情:

int foo(int n) 
{
    char buf[2048];
    int r = foo(n-1);
    // Do something with buf and return
}

上面的代码会很快吃掉大 n 的堆栈。但就你的情况而言,我真的不会担心,除非你有一些证据或至少有合理的怀疑它确实导致了问题。

如果它是一个更大的缓冲区,比如说 100kB 的数量级,那么我肯定会使用动态分配。 Windows 上的堆栈通常为 1MB,Linux 上的堆栈通常为 8MB。所以这不是“不浪费内存”的问题,而是不炸毁堆栈的问题。

关于c - 在 C 语言的循环中重复在堆栈上创建缓冲区是不好的做法吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62837763/

相关文章:

c - Flex/Bison 多遍类解析

mysql - 优化SQL : How to rewrite this query to boost performance?(使用子查询,摆脱GROUP BY?)

python - 避免 tensorflow 中的重复图(LSTM 模型)

c# - FileStream 在应用程序冷启动时非常慢

java - Java 中有很多类会降低性能吗?

linux - bash:一次从字符串中读取一个字符

c++ - 在 linux 上使用 c++ 中的键退出无限循环

c - 不同的编译方式导致同一个动态库产生不同的结果

java - 定义的参数评估顺序导致次优代码?

被调用的对象不是函数 - 如何正确嵌套 header 来调用方法