c - 学习所需的环境设置 "*Computer Systems:A Programmer' s Perspective*"

标签 c compiler-optimization cpu-architecture

我正在阅读《计算机系统:程序员的视角》一书,并尝试在配备 Intel Core i7 的 Macbook Pro 上执行该书提供的代码。

但是有些代码并不完全按照书上的建议运行。

这个 C 示例旨在演示相同的 float 存储在内存中和存储在寄存器中时会有所不同。

#include<stdio.h>

double recip( int denom )
{
  return 1.0/(double) denom;
}

void do_nothing(){} /* to  clear the register */

void fcomp( int denom)
{
  double r1, r2;
  int t1, t2;

  r1 = recip(denom); /* stored in memory */
  r2 = recip(denom); /* stored in register */
  t1 = r1 == r2;     /* Compares register to memory */
  do_nothing();      /* Forces register save to memory */
  t2 = r1 == r2;     /* Compares memory to memory */
  printf("test1 t1: r1 %f %c= r2 %f\n", r1, t1 ? '=' : '!', r2);
  printf("test1 t1: r2 %f %c= r2 %f\n", r1, t2 ? '=' : '!', r2);
}

main(){
  int demon = 10;
  fcomp(demon);
}

与带有“O2”选项的gcc相比,书上建议的结果应该是:

test1 t1: r1 0.100000 != r2 0.100000
test2 t1: r1 0.100000 == r2 0.100000

但是,我得到了两个“==”并且想知道为什么。对这本书的环境设置有什么建议吗?非常感谢。

最佳答案

书中的示例(很可能)针对 Intel CPU 中 x87 FPU 的特定属性:这种 FPU 类型的主要属性是它仅提供具有(可见)80 位精度的寄存器。因此,当加载到 FPU 寄存器中时,32 或 64 位 float 将转换为 80 位 float 。此外,通常算术运算都是以全精度执行的,因此如果将某个值保存在 FPU 寄存器中供以后使用,它不会像复制到内存然后加载的值那样四舍五入到 32 或 64 位稍后回来。因此,值是否保存在寄存器中会产生影响。

但是,Mac OS X(我想您在 Macbook 上使用)不使用 x87 FPU,它使用 SSE 单元:SSE 提供 32 位和 64 位浮点寄存器和操作,因此没有区别如果一个值保存在寄存器中或存储在内存中(关于其精度)。每次操作后结果总是四舍五入。这通常也适用于 Windows 和 Linux 上的 64 位可执行文件。

例如32位,Linux或Windows情况不同。 x87 或 SSE 单元的使用取决于环境,通常使用 x87 FPU,因为 32 位机器可能不支持所需的 SSE2 指令,尽管最后一个不带 SSE2 的 CPU 大约是在 10 年前构建的。

关于c - 学习所需的环境设置 "*Computer Systems:A Programmer' s Perspective*",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19308894/

相关文章:

c - C语言中如何查找数组的索引号

arrays - 在 Swift 中对 Array 调用 .count 时分配计数变量

c# - 为什么 Debug 构建中的 C# JIT 汇编代码中的每个方法中都有 cmp + je

ios - AppStore提交架构报错9000 armv7

c - 解释 proc/<pid>/maps 输出的不同行

在C中将double转换为ascii

assembly - Neoverse N1 中 lsl >4 的 add 管道

c++ - 如何为性能设计对象

返回 char* 的 C 函数的 C# pinvoke

c++ - 为什么在使用 -O3 标志函数编译 C++ 代码后生成错误的输出?