c - 使用分配的空间来存储多个数组

标签 c arrays pointers memory-management c11

下面的代码是正确的吗?

假设已知所有对象指针类型具有相同的大小和对齐方式,且大小不大于 8。

// allocate some space to A, and set *A and **A to different regions of that space
char*** A = malloc(92);
*A = (char**)( (char*)A + 2*sizeof(char**) );
**A = (char*)*A + 4*sizeof(char*);

// initialize the second char** object
A[1] = *A + 2;

// write four strings further out in the space
strcpy(A[0][0],"string-0-0");
A[0][1] = A[0][0] + strlen(A[0][0]) + 1;
strcpy(A[0][1],"string-0-1");
A[1][0] = A[0][1] + strlen(A[0][1]) + 1;
strcpy(A[1][0],"string-1-0");
A[1][1] = A[1][0] + strlen(A[1][0]) + 1;
strcpy(A[1][1],"string-1-1");

我发现这样的东西在无法直接释放对象的情况下很有用。例如,假设 A[1][1] 可能会或可能不会重新分配给字符串文字的地址。无论哪种方式,您都可以释放 A。此外,对 malloc 的调用次数也被最小化。

我担心这可能不是正确的代码是基于以下原因。使用标准的草案版本,我有:

7.22.3 Memory management functions

  1. ...The pointer returned if the allocation succeeds is suitably aligned so that it may be assigned to a pointer to any type of object with a fundamental alignment requirement and then used to access such an object or an array of such objects in the space allocated (until the space is explicitly deallocated)...

因此我保证能够将空间用作单一类型的数组。我找不到任何可以将其用作两种不同类型(char* 和 char**)的数组的保证。请注意,将某些空间用作字符数组是独一无二的,因为任何对象都可以作为字符类型数组访问。

有效类型的规则与这种方法一致,因为没有单独的字节被用作两种不同类型的一部分。

虽然上面表明似乎没有明显违反标准,但标准也没有明确允许这种行为,我们有第 4 章第 2 段(强调):

If a ‘‘shall’’ or ‘‘shall not’’ requirement that appears outside of a constraint or runtime constraint is violated, the behavior is undefined. Undefined behavior is otherwise indicated in this International Standard by the words ‘‘undefined behavior’’ or by the omission of any explicit definition of behavior. There is no difference in emphasis among these three; they all describe ‘‘behavior that is undefined’’.

当内存模型本身如此模糊时,这就有点模糊了。使用 malloc() 返回的空间来存储任何(一种)类型的数组显然需要明确的允许,我在上面引用了该允许。因此,有人可能会争辩说,将该空间用于不同类型的不相交数组也需要明确允许,如果没有它,将作为第 4 章的未定义行为留下。

所以,具体来说,如果代码示例是正确的,那么根据上面引用的标准第 4 章的部分,它没有明确定义因此未定义的论点有什么问题?

最佳答案

假设任何对象从分配区域开始的偏移量是对齐的倍数,并且假设在分配的生命周期内没有内存块被用作超过一种类型,则不会有问题。

一个令人讨厌的陷阱是,虽然有一些算法(例如哈希表)可以很好地处理一个最初填充了任意值的表(给定一个可能正确也可能不正确的值,代码可能能够确定值是否正确的速度要快得多——O(1) vs O(N)——比它在没有初始猜测的情况下找到正确的值要快得多),这种行为在使用 gcc 或 clang 时可能不可靠。他们解释标准的方式,将内存写入一种类型并读取另一种非字符类型会产生未定义的行为,即使目标类型没有陷阱表示,即使转换为新类型的指针从未使用过(以其原始形式)之后,即使代码对任何值都能正确工作,在数据尚未作为新类型写入的情况下,读取可能已经产生。

给定:

float *fp;
uint32_t *ip;

*fp = 1.0f;
*ip = 23;

如果 fp 和 ip 标识相同的存储,则行为将被定义,并且 之后需要存储以容纳 23。另一方面,给定:

float *fp;
uint32_t *ip;

*fp = 1.0f;
uint32_t temp = *ip;
*ip = 23;

编译器可以利用未定义行为重新排序 操作,因此写入 *fp 发生在写入 *ip 之后。如果数据被重新用于哈希表之类的东西,编译器就不太可能有效地应用这种优化,但“智能”编译器可能会在写入有用数据之后重新排序无用数据的写入。这种“优化”不太可能破坏事物,但没有标准定义的方法来防止它们,除非通过释放和重新分配存储(如果使用托管系统并且可以容忍性能下降和可能的碎片)或者在重新使用之前清除存储(这可能会将 O(1) 操作变成 O(N))。

关于c - 使用分配的空间来存储多个数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38467256/

相关文章:

c - 使用 void 指针的 C 中的泛型编程

c - 如何更快地生成斐波那契

c - 如何将时间(NULL)生成的随机种子存储在文本文件中?

c - 在 C 中从 typedef 结构设置和获取数组的值

python - 在 numpy 数组中找到平衡点

c - 将节点添加到单链列表的中间

c - 自增自减运算符

c - 显示一些小数位 C

ios - 如何计算 Swift 数组中某个元素的出现次数?

c - 写一个函数到 malloc 双指针