c - 为什么C中的箭头(->)运算符存在?

标签 c pointers dereference

点(.)运算符用于访问结构的成员,而C中的箭头运算符(->)用于访问由所涉及的指针引用的结构的成员。

指针本身没有任何可通过点运算符访问的成员(实际上,它只是一个数字,描述了虚拟内存中的位置,因此它没有任何成员)。因此,如果我们将点运算符定义为在指针上使用时自动取消引用该指针(编译器在编译时知道的信息afaik),则将不会有歧义。

那么,为什么语言创建者决定通过添加此看似不必要的运算符来使事情变得更复杂?重大的设计决定是什么?

最佳答案

我将您的问题解释为两个问题:1)为什么->甚至存在,以及2)为什么.不会自动取消引用指针。这两个问题的答案都有历史渊源。

为什么->甚至存在?

在C语言的第一个版本中(我将其称为“ C Reference Manual”的CRM,1975年5月随第六版Unix一起提供),运算符->具有非常排他的含义,与*并不同义词和.组合

CRM描述的C语言在许多方面与现代C都有很大不同。在CRM结构成员中,实现了字节偏移的全局概念,该概念可以无限制地添加到任何地址值中。即所有结构成员的所有名称都具有独立的全局含义(因此,必须是唯一的)。例如,您可以声明

struct S {
  int a;
  int b;
};


名称a代表偏移量0,而名称b代表偏移量2(假设int类型为2,没有填充)。该语言要求翻译单元中所有结构的所有成员都必须具有唯一的名称或代表相同的偏移值。例如。在同一个翻译单元中,您还可以声明

struct X {
  int a;
  int x;
};


这样就可以了,因为名称a始终代表偏移量0。但是,此附加声明

struct Y {
  int b;
  int a;
};


在形式上将是无效的,因为它试图将a重新定义为偏移量2,将b重新定义为偏移量0。

这就是->运算符出现的地方。由于每个struct成员名称都有自己的自足全局含义,因此该语言支持此类表达式

int i = 5;
i->b = 42;  /* Write 42 into `int` at address 7 */
100->a = 0; /* Write 0 into `int` at address 100 */


编译器将第一个赋值解释为“获取地址5,向其添加偏移量2,并将42赋给结果地址的int值”。即以上将在地址42int值中分配7。请注意,使用->并不关心左侧表达式的类型。左侧被解释为右值数字地址(可以是指针或整数)。

*.组合无法实现这种欺骗性。你做不到

(*i).b = 42;


因为*i已经是无效的表达式。 *运算符与.分开,因此对其操作数施加了更严格的类型要求。为了提供解决此限制的功能,CRM引入了->运算符,该运算符与左侧操作数的类型无关。

正如Keith在评论中所指出的,->* + .组合之间的区别就是CRM在7.1.8中被称为“放宽需求”:除了放宽了为指针类型,表达式E1完全等同于E1−>MOS

后来,在K&R C中,对CRM中最初描述的许多功能进行了重做。完全删除了“结构成员作为全局偏移量标识符”的想法。并且(*E1).MOS运算符的功能变得与->*组合的功能完全相同。

为什么.无法自动取消引用指针?

同样,在该语言的CRM版本中,需要.运算符的左操作数为左值。那是对该操作数施加的唯一要求(这就是它与.不同的原因,如上所述)。请注意,CRM不需要->的左操作数具有结构类型。它只是要求它是一个左值,任何左值。这意味着在C的CRM版本中,您可以编写如下代码

struct S { int a, b; };
struct T { float x, y, z; };

struct T c;
c.b = 55;


在这种情况下,即使类型.没有名为55的字段,编译器也会将int写入位于连续存储器块中称为c的字节偏移2处的struct T值中。编译器根本不关心b的实际类型。它关心的只是c是一个左值:某种可写的内存块。

现在请注意,如果您这样做

S *s;
...
s.b = 42;


该代码将被视为有效(因为c也是一个左值),并且编译器将仅尝试以字节偏移量2将数据写入指针s本身,不用说,类似这样的事情很容易导致内存溢出,但是语言并不关心此类问题。

即在该语言的该版本中,您提出的关于重载指针类型的运算符s的想法将不起作用:与指针(与左值指针或任何左值一起使用)时,运算符.已经具有非常特殊的含义。毫无疑问,这是非常奇怪的功能。但是当时在那里。

当然,这种怪异的功能并不是在重做的C-K&R C版本中针对指针引入重载的.运算符(如您所建议的)的强烈理由。但这还没有完成。也许那时是必须要支持一些用CRM版本的C编写的遗留代码。

(《 1975 C参考手册》的URL可能不稳定。here可能是另一个副本,可能会有一些细微的差别。)

关于c - 为什么C中的箭头(->)运算符存在?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59554689/

相关文章:

c - 使用 mmap 在 C 中共享内存中的结构

ios - 如何将 __autoreleasing 地址保留为类中的强属性?

c - 从不兼容的指针类型传递 arg 1 of `foo'

rust - 自动解除引用和解除引用强制之间有什么关系?

c++ - 使用指针访问 QVector 的元素

c - 访问 C 中动态分配的嵌套结构

java - 使用 JNI 仅将缓冲区的一部分从 native 代码复制到 Java

c - 为什么我的程序在使用 scanf 后暂停?

c - 这段代码有什么Bug?

c++ - 将 vector 传递给函数(指针/地址)