当 src 字符串以 \n
结尾时,我收到无效读取错误,当我删除 \n
时错误消失:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int main (void)
{
char *txt = strdup ("this is a not socket terminated message\n");
printf ("%d: %s\n", strlen (txt), txt);
free (txt);
return 0;
}
valgrind 输出:
==18929== HEAP SUMMARY:
==18929== in use at exit: 0 bytes in 0 blocks
==18929== total heap usage: 2 allocs, 2 frees, 84 bytes allocated
==18929==
==18929== All heap blocks were freed -- no leaks are possible
==18929==
==18929== ERROR SUMMARY: 1 errors from 1 contexts (suppressed: 0 from 0)
==18929==
==18929== 1 errors in context 1 of 1:
==18929== Invalid read of size 4
==18929== at 0x804847E: main (in /tmp/test)
==18929== Address 0x4204050 is 40 bytes inside a block of size 41 alloc'd
==18929== at 0x402A17C: malloc (in /usr/lib/valgrind/vgpreload_memcheck-x86-linux.so)
==18929== by 0x8048415: main (in /tmp/test)
==18929==
==18929== ERROR SUMMARY: 1 errors from 1 contexts (suppressed: 0 from 0)
如何在不牺牲新行字符的情况下解决这个问题?
最佳答案
这与换行符无关,也与 printf 格式说明符无关。您已经在 strlen()
中发现了可以说是错误的东西,我可以告诉您一定是在使用 gcc。
您的程序代码完全没问题。 printf 格式说明符可能会好一点,但它不会导致您看到的 valgrind 错误。让我们看看那个 valgrind 错误:
==18929== Invalid read of size 4
==18929== at 0x804847E: main (in /tmp/test)
==18929== Address 0x4204050 is 40 bytes inside a block of size 41 alloc'd
==18929== at 0x402A17C: malloc (in /usr/lib/valgrind/vgpreload_memcheck-x86-linux.so)
==18929== by 0x8048415: main (in /tmp/test)
“Invalid read of size 4”是我们必须理解的第一条信息。这意味着处理器运行了一条指令,该指令将从内存中加载 4 个连续字节。下一行表示尝试读取的地址是“地址 0x4204050 是分配大小为 41 的 block 内的 40 字节。”
有了这些信息,我们就可以搞清楚了。首先,如果将 '\n'
替换为 '$'
或任何其他字符,将产生相同的错误。试试吧。
其次,我们可以看到您的字符串中有 40 个字符。添加 \0
终止字符会使用于表示字符串的总字节数达到 41。
因为我们收到消息“地址 0x4204050 是分配大小为 41 的 block 内的 40 字节”,所以我们现在知道出了什么问题。
strdup()
分配了正确的内存量,41 字节。strlen()
尝试读取 4 个字节,从第 40 个字节开始,这将扩展到不存在的第 43 个字节。- valgrind 发现了问题
这是一个 glib() 错误。曾几何时,一个名为 Tiny C Compiler (TCC) 的项目开始起飞。巧合的是,glib 已完全更改,因此不再存在普通的字符串函数,例如 strlen()
。它们被优化版本所取代,这些版本使用各种方法读取内存,例如一次读取四个字节。同时更改 gcc 以生成对适当实现的调用,具体取决于输入指针的对齐、编译的硬件等。当对 GNU 环境的这种更改使得生成一个如此困难时,TCC 项目被放弃了新的 C 编译器,取消了对标准库使用 glib 的能力。
如果您报告错误,glib 维护者可能不会修复它。原因是在实际使用中,这可能永远不会导致实际崩溃。 strlen
函数一次读取 4 个字节,因为它发现地址是 4 字节对齐的。从 4 字节对齐的地址读取 4 个字节总是可能的,而不会出现段错误,因为从该地址读取 1 个字节会成功。因此,来自 valgrind 的警告并没有揭示潜在的崩溃,只是关于如何编程的假设不匹配。我认为 valgrind 在技术上是正确的,但我认为 glib 维护者做任何事情来压制警告的可能性为零。
关于c - 当字符串文字以换行符结尾时,strdup 大小为 4 的无效读取\n,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35021713/