c - 当字符串文字以换行符结尾时,strdup 大小为 4 的无效读取\n

标签 c strdup

当 src 字符串以 \n 结尾时,我收到无效读取错误,当我删除 \n 时错误消失:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int main (void)
{
    char *txt = strdup ("this is a not socket terminated message\n");
    printf ("%d: %s\n", strlen (txt), txt);
    free (txt);
    return 0;
}

valgrind 输出:

==18929== HEAP SUMMARY:
==18929==     in use at exit: 0 bytes in 0 blocks
==18929==   total heap usage: 2 allocs, 2 frees, 84 bytes allocated
==18929== 
==18929== All heap blocks were freed -- no leaks are possible
==18929== 
==18929== ERROR SUMMARY: 1 errors from 1 contexts (suppressed: 0 from 0)
==18929== 
==18929== 1 errors in context 1 of 1:
==18929== Invalid read of size 4
==18929==    at 0x804847E: main (in /tmp/test)
==18929==  Address 0x4204050 is 40 bytes inside a block of size 41 alloc'd
==18929==    at 0x402A17C: malloc (in /usr/lib/valgrind/vgpreload_memcheck-x86-linux.so)
==18929==    by 0x8048415: main (in /tmp/test)
==18929== 
==18929== ERROR SUMMARY: 1 errors from 1 contexts (suppressed: 0 from 0)

如何在不牺牲新行字符的情况下解决这个问题?

最佳答案

这与换行符无关,也与 printf 格式说明符无关。您已经在 strlen() 中发现了可以说是错误的东西,我可以告诉您一定是在使用 gcc。

您的程序代码完全没问题。 printf 格式说明符可能会好一点,但它不会导致您看到的 valgrind 错误。让我们看看那个 valgrind 错误:

==18929== Invalid read of size 4
==18929==    at 0x804847E: main (in /tmp/test)
==18929==  Address 0x4204050 is 40 bytes inside a block of size 41 alloc'd
==18929==    at 0x402A17C: malloc (in /usr/lib/valgrind/vgpreload_memcheck-x86-linux.so)
==18929==    by 0x8048415: main (in /tmp/test)

“Invalid read of size 4”是我们必须理解的第一条信息。这意味着处理器运行了一条指令,该指令将从内存中加载 4 个连续字节。下一行表示尝试读取的地址是“地址 0x4204050 是分配大小为 41 的 block 内的 40 字节。”

有了这些信息,我们就可以搞清楚了。首先,如果将 '\n' 替换为 '$' 或任何其他字符,将产生相同的错误。试试吧。

其次,我们可以看到您的字符串中有 40 个字符。添加 \0 终止字符会使用于表示字符串的总字节数达到 41。

因为我们收到消息“地址 0x4204050 是分配大小为 41 的 block 内的 40 字节”,所以我们现在知道出了什么问题。

  1. strdup() 分配了正确的内存量,41 字节。
  2. strlen() 尝试读取 4 个字节,从第 40 个字节开始,这将扩展到不存在的第 43 个字节。
  3. valgrind 发现了问题

这是一个 glib() 错误。曾几何时,一个名为 Tiny C Compiler (TCC) 的项目开始起飞。巧合的是,glib 已完全更改,因此不再存在普通的字符串函数,例如 strlen()。它们被优化版本所取代,这些版本使用各种方法读取内存,例如一次读取四个字节。同时更改 gcc 以生成对适当实现的调用,具体取决于输入指针的对齐、编译的硬件等。当对 GNU 环境的这种更改使得生成一个如此困难时,TCC 项目被放弃了新的 C 编译器,取消了对标准库使用 glib 的能力。

如果您报告错误,glib 维护者可能不会修复它。原因是在实际使用中,这可能永远不会导致实际崩溃。 strlen 函数一次读取 4 个字节,因为它发现地址是 4 字节对齐的。从 4 字节对齐的地址读取 4 个字节总是可能的,而不会出现段错误,因为从该地址读取 1 个字节会成功。因此,来自 valgrind 的警告并没有揭示潜在的崩溃,只是关于如何编程的假设不匹配。我认为 valgrind 在技术上是正确的,但我认为 glib 维护者做任何事情来压制警告的可能性为零。

关于c - 当字符串文字以换行符结尾时,strdup 大小为 4 的无效读取\n,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35021713/

相关文章:

c - 在输入文件中使用数组,For和If结构

c - c中的缓冲区溢出和将局部变量压入堆栈的顺序

c - 在 flex 中使用 strdup()

c++ - 循环中的免费 strdup 输出

c - 释放导致崩溃

c - 如何为 jvm.dll 设置系统范围的环境变量

C malloc 和 memcpy 在拆分 char 数组时给出条件跳转 valgrind 错误

c - 从 flex/bison 中释放在 strdup() 中分配的字符串

c - strdup在复制char数组时是否添加了 '\0'?

c - C 中的半继承 : How does this snippet work?