c - C 中的字符串拆分器 - 它是如何工作的?

标签 c split substring c-strings function-definition

我继承了一个大型代码库,并且有一个实用函数可以在 : char 上拆分字符串。我了解其工作原理的大约 80%,但我不了解 *token = '\0'; 行。

非常感谢任何指点。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define MAX_TOKEN_SIZE 200

const char *splitter(const char *str, char delimiter, char *token) {

    while (*str && (delimiter != *str)) {
        *token++ = *str;
        str++;            
    }
    if (delimiter == *str)
        str++;

    *token = '\0';    // what is this line doing?

    //how could the token be correct in the main() after setting it to null terminator 
    //here?

    return str;
} 

int main() {
    char token[MAX_TOKEN_SIZE + 1];  
    const char *env = "/bin:/sbin:::/usr/bin";
    while (*env) {
        env = splitter(env, ':', token);  

        //if token is empty, set it to "./"
        if ((token != NULL) && (token[0] == '\0')) {
            strcpy(token, "./\0");            
        }

        printf("%s\n", token)  ;
    }
    return 0;
}

输出是正确的:

/bin
/sbin
./
./
/usr/bin

最佳答案

对于初学者,我将指出一个冗余代码。

这个if语句

if ((token != NULL) && (token[0] == '\0')) {

有一个无意义的表达式,因为 token 永远不能等于 NULL。 main 中的 token 声明为字符数组。所以你可以写

if ( token[0] == '\0') {

同样在这个语句的字符串字面量中

strcpy(token, "./\0");

显式终止零字符 '\0' 是多余的。你可以只写

strcpy(token, "./");

关于你的问题。

splitter 函数提取一个字符序列,直到遇到字符delimiter 并将其存储在数组token 中,

while (*str && (delimiter != *str)){
     *token++ = *str;
     str++;            
}

但是结果序列不代表字符串。它应以终止零字符 \0 和此语句结束

*token = '\0'; 

将终止零字符附加到存储在数组 token 中的提取序列的末尾。

至于这个说法

if (delimiter == *str)
    str++;

那么如果它不是字符串的结尾str(即如果当前字符*str不是终止零字符'\0';如果它等于 delimiter 那么它不是终止零字符)然后指针 str 递增并从函数返回以允许调用者在函数的下一次调用中继续从下一个位置开始处理字符串。

所以最初你有

 const char *env = "/bin:/sbin:::/usr/bin";

该函数复制字符 /bin 并附加零字符 '\0',即字符串“/bin”到数组 token 。在这个调用之后,函数返回的指针将指向子字符串

"/sbin:::/usr/bin"

因为前面的字符 ':' 被这个语句跳过了

if (delimiter == *str)
    str++;

在函数内。

关于c - C 中的字符串拆分器 - 它是如何工作的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73667156/

相关文章:

javascript - 使用区分大小写字符的正则表达式拆分字符串上的名称

javascript - 在两个分隔符上拆分字符串?

javascript - jquery给字符串加1

java - 使用 java 将文本文件修剪到第一列

c - 如果换行符 '0A' 是文件的一部分,如何读取完整文件。

c - MISRA-C适用于Linux应用吗

c - 打印整数和 float 的运算结果

string - Powershell截断字符串

c++ - Symbian C++ - 描述符上的子字符串操作

c++ - 使文件指针读/写到内存中的位置