所以最近我在考虑 strcpy 并回到 K&R,他们将实现显示为
while (*dst++ = *src++) ;
但是我错误地将其转录为:
while (*dst = *src)
{
src++; //technically could be ++src on these lines
dst++;
}
无论如何,这让我开始思考编译器是否真的会为这两者生成不同的代码。我最初的想法是它们应该几乎相同,因为 src 和 dst 正在递增但从未使用过我认为编译器会知道不要尝试在生成的机器代码中将它们实际保存为“变量”。
在 32 位 Release模式 (/O2) 中使用 windows7 和 VS 2010 C++ SP1 构建,我得到了上述两个版本的反汇编代码。为了防止函数本身直接引用输入并被内联,我为每个函数创建了一个 dll。我省略了生成的 ASM 的序言和结语。
while (*dst++ = *src++)
6EBB1003 8B 55 08 mov edx,dword ptr [src]
6EBB1006 8B 45 0C mov eax,dword ptr [dst]
6EBB1009 2B D0 sub edx,eax //prepare edx so that edx + eax always points to src
6EBB100B EB 03 jmp docopy+10h (6EBB1010h)
6EBB100D 8D 49 00 lea ecx,[ecx] //looks like align padding, never hit this line
6EBB1010 8A 0C 02 mov cl,byte ptr [edx+eax] //ptr [edx+ eax] points to char in src :loop begin
6EBB1013 88 08 mov byte ptr [eax],cl //copy char to dst
6EBB1015 40 inc eax //inc src ptr
6EBB1016 84 C9 test cl,cl // check for 0 (null terminator)
6EBB1018 75 F6 jne docopy+10h (6EBB1010h) //if not goto :loop begin
;
上面我已经注释了代码,本质上是一个单循环,只有 1 次检查 null 和 1 次内存复制。
现在让我们看看我的错误版本:
while (*dst = *src)
6EBB1003 8B 55 08 mov edx,dword ptr [src]
6EBB1006 8A 0A mov cl,byte ptr [edx]
6EBB1008 8B 45 0C mov eax,dword ptr [dst]
6EBB100B 88 08 mov byte ptr [eax],cl //copy 0th char to dst
6EBB100D 84 C9 test cl,cl //check for 0
6EBB100F 74 0D je docopy+1Eh (6EBB101Eh) // return if we encounter null terminator
6EBB1011 2B D0 sub edx,eax
6EBB1013 8A 4C 02 01 mov cl,byte ptr [edx+eax+1] //get +1th char :loop begin
{
src++;
dst++;
6EBB1017 40 inc eax
6EBB1018 88 08 mov byte ptr [eax],cl //copy above char to dst
6EBB101A 84 C9 test cl,cl //check for 0
6EBB101C 75 F5 jne docopy+13h (6EBB1013h) // if not goto :loop begin
}
在我的版本中,我看到它首先将第 0 个字符复制到目标位置,然后检查 null ,最后进入再次检查 null 的循环。所以循环在很大程度上保持不变,但现在它处理循环之前的第 0 个字符。与第一种情况相比,这当然是次优的。
我想知道是否有人知道为什么阻止编译器生成与第一个示例相同(或接近相同)的代码。这是 ms 编译器的特定问题还是可能与我的编译器/链接器设置有关?
这里是完整的代码,2 个文件(一个函数替换另一个)。
// in first dll project
__declspec(dllexport) void docopy(const char* src, char* dst)
{
while (*dst++ = *src++);
}
__declspec(dllexport) void docopy(const char* src, char* dst)
{
while (*dst = *src)
{
++src;
++dst;
}
}
//seprate main.cpp file calls docopy
void docopy(const char* src, char* dst);
char* source ="source";
char destination[100];
int main()
{
docopy(source, destination);
}
最佳答案
因为在第一个例子中,后增量总是发生,即使 src 开始指向一个空字符。在相同的起始情况下,第二个示例不会增加指针。
关于c++ - 为什么 vs c++ 2010 编译器会为相似的函数生成不同的汇编代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9844066/