c - 取消引用 void**-casted type** 会打破严格的别名吗?

标签 c undefined-behavior strict-aliasing

考虑这个人为的例子:

#include <stddef.h>

static inline void nullify(void **ptr) {
    *ptr = NULL;
}

int main() {
    int i;
    int *p = &i;
    nullify((void **) &p);
    return 0;
}

&p(int **)被转换为 void **,然后取消引用。这是否违反了严格的别名规则?

根据standard :

An object shall have its stored value accessed only by an lvalue expression that has one of the following types:

  • a type compatible with the effective type of the object,

因此,除非 void * 被认为兼容 int *,否则这违反了严格的别名规则。

但是,这不是 gcc 警告所建议的(即使它什么也没证明)。

编译此示例时:

#include <stddef.h>
void f(int *p) {
    *((float **) &p) = NULL;
}

gcc 警告严格别名:

$ gcc -c -Wstrict-aliasing -fstrict-aliasing a.c
a.c: In function ‘f’:
a.c:3:7: warning: dereferencing type-punned pointer will break strict-aliasing rules [-Wstrict-aliasing]
      *((float **) &p) = NULL;
      ~^~~~~~~~~~~~~

但是,对于 void **,它不会发出警告:

#include <stddef.h>
void f(int *p) {
    *((void **) &p) = NULL;
}

那么严格的别名规则是否有效?

如果不是,如何编写一个函数来取消任何不违反严格别名规则的指针(例如)?

最佳答案

没有一般要求实现对不同的指针类型使用相同的表示。在将使用不同表示的平台上,例如一个 int* 和一个 char*,将无法支持可以作用于两个 的单个指针类型 void* int*char* 可以互换。尽管可以互换地处理指针的实现将有助于在使用兼容表示的平台上进行低级编程,但并非所有平台都支持这种能力。因此,该标准的作者没有理由强制支持此类功能,而不是将其视为实现质量问题。

据我所知,像 icc 这样适合低级编程的高质量编译器,以及所有指针都具有相同表示的目标平台,在构造如下方面没有困难:

void resizeOrFail(void **p, size_t newsize)
{
  void *newAddr = realloc(*p, newsize);
  if (!newAddr) fatal_error("Failure to resize");
  *p = newAddr;
}

anyType *thing;

... code chunk #1 that uses thing
   resizeOrFail((void**)&thing, someDesiredSize);
... code chunk #2 that uses thing

请注意,在此示例中,获取事物地址的行为以及所有使用结果指针的行为都明显发生在使用 thing 的两个代码块之间。因此,没有实际的别名,任何不是故意盲目的编译器都可以毫不费力地认识到将 thing 的地址传递给 reallocorFail 的行为可能会导致 要修改的东西

另一方面,如果用法是这样的:

void **myptr;    
anyType *thing;

myptr = &thing;
... code chunk #1 that uses thing
*myptr = realloc(*myptr, newSize);
... code chunk #2 that uses thing

那么即使是高质量的编译器也可能没有意识到 thing 可能会在使用它的两个代码块之间受到影响,因为没有对 anyType* 类型的任何引用在这两个 block 之间。在这样的编译器上,有必要编写如下代码:

myptr = &thing;
... code chunk #1 that uses thing
*(void *volatile*)myptr = realloc(*myptr, newSize);
... code chunk #2 that uses thing

让编译器知道 *mtptr 上的操作正在做一些“奇怪”的事情。用于低级编程的高质量编译器会将此视为他们应该避免在此类操作中缓存 thing 值的标志,但即使是 volatile 限定符也不会对于仅适用于不涉及低级编程的目的的优化模式中的 gcc 和 clang 等实现来说已经足够了。

如果像 reallocOrFail 这样的函数需要使用不太适合低级编程的编译器模式,它可以写成:

void resizeOrFail(void **p, size_t newsize)
{
  void *newAddr;
  memcpy(&newAddr, p, sizeof newAddr);
  newAddr = realloc(newAddr, newsize);
  if (!newAddr) fatal_error("Failure to resize");
  memcpy(p, &newAddr, sizeof newAddr);
}

然而,这将要求编译器允许 resizeOrFail 可能改变任何类型的任意对象的值的可能性——不仅仅是数据指针——因此不必要地损害应该是什么有用的优化。更糟糕的是,如果有问题的指针恰好存储在堆上(并且不是 void* 类型),仍然允许不适合低级编程的符合标准的编译器假设第二个 memcpy 不可能影响它。

低级编程的一个关键部分是确保选择适合该目的的实现和模式,并知道他们何时可能需要 volatile 限定符来帮助他们。一些编译器供应商可能声称任何要求编译器适合其目的的代码都是“错误的”,但试图安抚这些供应商将导致代码效率低于使用适合其目的的高质量编译器生成的代码。

关于c - 取消引用 void**-casted type** 会打破严格的别名吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52128642/

相关文章:

c - 用户想玩多少次游戏 c 语言

c - 如何编写通用函数对 C 中的字符串数组进行排序?

c - 为什么 if 语句中未定义的行为为 true?

C: 是否使用转换为 "outer"结构类型的指针访问嵌套结构的初始成员?

rust - 如何使用(不安全的)别名?

c - C 中的嵌套结构和指针

c - C 中的二进制文件 : Using fread function and an nlogn sorting issue

c++ - 传递引用未初始化变量是未定义的行为吗?

null - 为什么取消引用空原始指针未定义行为?

c - 强制转换不完整的结构指针是否是未定义的行为?