c - 需要帮助解决警告 : dereferencing type-punned pointer will break strict-aliasing rules

标签 c pointers gcc casting strict-aliasing

我正在编写一组 C 代码来优化它。我在修复损坏的代码时遇到警告。

环境是Linux,C99,使用-Wall -O2标志进行编译。

最初,结构体文本的定义如下:

    struct text {
        char count[2];
        char head[5];
        char textdata[5];
    }

代码是将指针T1T2返回到预期的headtextdata字符串:

int main(void) {
    struct text *T1;
    char *T2;
    char data[] = "02abcdeabcde";

    T1 = (struct text *)data;
    T2 = T1->textdata;
    gettextptr((char *)T1, T2);
    printf("\nT1 = %s\nT2 = %s\n", (char *)T1, T2);
    return (0);
}

void gettextptr(char *T1, char *T2) {
    struct text *p;
    int count;

    p = (struct text *)T1;
    count = (p->count[0] - '0') * 10 + (p->count[1] - '0');

    while (count--) {
        if (memcmp(T2, T1, 2) == 0) {
            T1 += 2;
            T2 += 2;
        }
    }
}

这没有按预期工作。预期返回第一个“c”和最后一个“e”的地址。通过GDB,我发现,一旦执行指针从gettextptr()返回到父函数,它不会保留T1T2的地址>。然后我尝试了另一种使用双指针“通过引用调用”的方法:

int main(void) {
    struct text *T1;
    char *T2;
    char data[] = "02abcdeabcde";

    T1 = (struct text *)data;
    T2 = T1->textdata;
    gettextptr((char **)&T1, &T2);
    printf("\nT1 = %s\nT2 = %s\n", (char *)T1, T2);
    return (0);
}

void gettextptr(char **T1, char **T2) {
    struct text *p;
    int count;

    p = (struct text *)(*T1);
    count = (p->count[0] - '0') * 10 + (p->count[1] - '0');

    while (count--) {
        if (memcmp(*T2, *T1, 2) == 0) {
            *T1 += 2;
            *T2 += 2;
        }
    }
}

当我使用 -Wall -O2 编译此代码时,我收到以下 GCC 警告:

 pointer.c: In function ‘main’:
 pointer.c:23: warning: dereferencing type-punned pointer will break strict-aliasing rules

所以:

  1. 第一种情况下代码是否按值调用?

  2. 在保持严格的别名规则的同时,是否允许使用 (char **) 进行转换?

  3. 我缺少什么来解决此警告?

最佳答案

严格的别名规则是 paragraph 6.5/7 of the Standard 。它基本上表示您只能通过兼容类型的左值(可能带有附加限定符)来访问对象;对应的有符号/无符号类型;其成员之一包含其中之一的数组、结构体或 union 类型,或者字符类型。您收到的诊断表明您的代码违反了该规则,而且确实多次违反了该规则。

你很早就陷入了麻烦:

    T1 = (struct text *)data;

这种转换是允许的,尽管不能保证生成的指针正确对齐,但是在不违反严格别名规则的情况下,您可以对 T1 做很多事情。特别是,如果您使用 *-> 取消引用它(这实际上是您接下来要做的事情),那么您将访问 char 数组就好像它是一个 struct text。这是不允许的,尽管反之则另当别论。

T1 转换为 char * 并通过该指针访问指向的数组(正如您稍后所做的那样)是您可以 处理它。

gettextexpr() 是相同的(两个版本)。它执行与上述相同类型的转换,并在访问 p->count 时取消引用转换后的指针。由此产生的行为违反了严格的别名规则,因此是未定义的。然而,GCC 在第二种情况下实际上提示的可能是像访问 *T1 一样访问 char *,而实际上它是一个 struct 文本*——另一个、单独的、严格的别名违规。

因此,回答您的具体问题:

  1. Was the code calling by value in first case?

C按值传递,所以是的。在第一种情况下,您按值传递两个 char 指针,然后可以使用它们来修改调用者的 char 数据。在第二种情况下,您按值传递两个 char * 指针,您可以并且确实使用它们来修改调用者的 char * 变量。

  1. Isn't (char **) permitted for casting while keeping strict aliasing rules?

不,绝对不是。转换 char *(不是char **)可以让您通过结果指针访问对象的表示,因为取消引用 char * 生成字符类型的左值,但没有任何类型可以在没有严格别名影响的情况下进行一般转换。

  1. What am I missing to resolve this warning?

您忽略了您正在尝试做的事情从根本上是不允许的。 C 不允许访问 char 数组,就好像它是 struct text 一样。尽管如此,编译器可能会接受这样做的代码,但其行为是未定义的。

通过放弃转换为结构的方法来解决警告,无论如何,这种方法只提供了语法糖的粉末。实际上,去掉所有的转换并编写更简单、更清晰:

    count = ((*T1)[0] - '0') * 10 + ((*T1)[1] - '0');

摆脱所有转换使用sscanf也许更清楚:

    sscanf(*T1, "%2d", &count);

另请注意,即使允许,您的特定访问模式似乎也会对结构成员的布局做出假设,而这些假设是语言不合理的。实现可能会在成员之间和最后一个成员之后使用任意填充,而您的代码无法适应这种情况。

关于c - 需要帮助解决警告 : dereferencing type-punned pointer will break strict-aliasing rules,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55982381/

相关文章:

c - 使用 fscanf 读入指针时出现段错误(核心转储)

C 结构体 : Can a function argument be used to deference a struct pointer

c++ - 在 C++ 中。 (*a).b 和 a->b 有什么区别?

c++ - `pragma pack(push, 1)` 在 GCC 4.4.7 中崩溃。可能的编译器错误?

c - 从 TCP 套接字拼接时,Linux 的 splice(2) 是否工作?

c - 如何使用指针打印字符数组中的每个字符?

c - 数组指向的结构? [C]

c - 在文本部分查找字符串

gcc - 如何将 -fvisibility 选项应用于静态库中的符号?

c - 'restrict' 关键字 - 为什么允许从外部限制变量分配给内部限制变量?