我正在编写一组 C 代码来优化它。我在修复损坏的代码时遇到警告。
环境是Linux,C99,使用-Wall -O2
标志进行编译。
最初,结构体文本的定义如下:
struct text {
char count[2];
char head[5];
char textdata[5];
}
代码是将指针T1
和T2
返回到预期的head
和textdata
字符串:
int main(void) {
struct text *T1;
char *T2;
char data[] = "02abcdeabcde";
T1 = (struct text *)data;
T2 = T1->textdata;
gettextptr((char *)T1, T2);
printf("\nT1 = %s\nT2 = %s\n", (char *)T1, T2);
return (0);
}
void gettextptr(char *T1, char *T2) {
struct text *p;
int count;
p = (struct text *)T1;
count = (p->count[0] - '0') * 10 + (p->count[1] - '0');
while (count--) {
if (memcmp(T2, T1, 2) == 0) {
T1 += 2;
T2 += 2;
}
}
}
这没有按预期工作。预期返回第一个“c”和最后一个“e”的地址。通过GDB,我发现,一旦执行指针从gettextptr()
返回到父函数,它不会保留T1
和T2
的地址>。然后我尝试了另一种使用双指针“通过引用调用”的方法:
int main(void) {
struct text *T1;
char *T2;
char data[] = "02abcdeabcde";
T1 = (struct text *)data;
T2 = T1->textdata;
gettextptr((char **)&T1, &T2);
printf("\nT1 = %s\nT2 = %s\n", (char *)T1, T2);
return (0);
}
void gettextptr(char **T1, char **T2) {
struct text *p;
int count;
p = (struct text *)(*T1);
count = (p->count[0] - '0') * 10 + (p->count[1] - '0');
while (count--) {
if (memcmp(*T2, *T1, 2) == 0) {
*T1 += 2;
*T2 += 2;
}
}
}
当我使用 -Wall -O2
编译此代码时,我收到以下 GCC 警告:
pointer.c: In function ‘main’:
pointer.c:23: warning: dereferencing type-punned pointer will break strict-aliasing rules
所以:
第一种情况下代码是否按值调用?
在保持严格的别名规则的同时,是否允许使用
(char **)
进行转换?我缺少什么来解决此警告?
最佳答案
严格的别名规则是 paragraph 6.5/7 of the Standard 。它基本上表示您只能通过兼容类型的左值(可能带有附加限定符)来访问对象;对应的有符号/无符号类型;其成员之一包含其中之一的数组、结构体或 union 类型,或者字符类型。您收到的诊断表明您的代码违反了该规则,而且确实多次违反了该规则。
你很早就陷入了麻烦:
T1 = (struct text *)data;
这种转换是允许的,尽管不能保证生成的指针正确对齐,但是在不违反严格别名规则的情况下,您可以对 T1
做很多事情。特别是,如果您使用 *
或 ->
取消引用它(这实际上是您接下来要做的事情),那么您将访问 char
数组就好像它是一个 struct text
。这是不允许的,尽管反之则另当别论。
将 T1
转换为 char *
并通过该指针访问指向的数组(正如您稍后所做的那样)是您可以 处理它。
gettextexpr()
是相同的(两个版本)。它执行与上述相同类型的转换,并在访问 p->count
时取消引用转换后的指针。由此产生的行为违反了严格的别名规则,因此是未定义的。然而,GCC 在第二种情况下实际上提示的可能是像访问 *T1
一样访问 char *
,而实际上它是一个 struct 文本*
——另一个、单独的、严格的别名违规。
因此,回答您的具体问题:
- Was the code calling by value in first case?
C仅按值传递,所以是的。在第一种情况下,您按值传递两个 char
指针,然后可以使用它们来修改调用者的 char
数据。在第二种情况下,您按值传递两个 char *
指针,您可以并且确实使用它们来修改调用者的 char *
变量。
- Isn't (char **) permitted for casting while keeping strict aliasing rules?
不,绝对不是。转换到 char *
(不是char **
)可以让您通过结果指针访问对象的表示,因为取消引用 char *
生成字符类型的左值,但没有任何类型可以在没有严格别名影响的情况下进行一般转换。
- What am I missing to resolve this warning?
您忽略了您正在尝试做的事情从根本上是不允许的。 C 不允许访问 char
数组,就好像它是 struct text
一样。尽管如此,编译器可能会接受这样做的代码,但其行为是未定义的。
通过放弃转换为结构的方法来解决警告,无论如何,这种方法只提供了语法糖的粉末。实际上,去掉所有的转换并编写更简单、更清晰:
count = ((*T1)[0] - '0') * 10 + ((*T1)[1] - '0');
摆脱所有转换使用sscanf
也许更清楚:
sscanf(*T1, "%2d", &count);
另请注意,即使允许,您的特定访问模式似乎也会对结构成员的布局做出假设,而这些假设是语言不合理的。实现可能会在成员之间和最后一个成员之后使用任意填充,而您的代码无法适应这种情况。
关于c - 需要帮助解决警告 : dereferencing type-punned pointer will break strict-aliasing rules,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55982381/