c - 使用汇编器和 C 接口(interface)执行多项操作

标签 c assembly intel fpu

我正在尝试使用 Intel 处理器的 FPU 单元的汇编程序在 C 接口(interface)内执行不同的操作。 要执行的操作是:

43.001 * 0.00751
0.00000001 * 1.4142135623730951
0.1 + 0.1 + 0.1 − 0.3

这是带有汇编接口(interface)的 C 代码:

#include <stdio.h>

int main(void) 
{
double r;
double s;
const double a = 1;
const double b = 0.1;
const double c = 43.001; 
const double d = 0.00751;
const double e = 0.00000001; 
const double f = 1.4142135623730951;    
const double g = 0.3;   

__asm__ ("fldl %1;" //cargo a
        "fldl %2;"  //cargo b
        "fldl %3;"  //cargo c
        "fldl %4;"  //cargo d
        "faddp;"   // suma a con b y lo guarda en st(0)
        "fmul st2,st3" // c*d y lo guarda en st(2)
        "fstl %0;" : "=m" (r) : "m" (a), "m" (b)
        "fstl %1;" : "=m" (s) : "m" (c), "m" (d)    //acá creí que se se podia hacer la multiplicación
        );

printf("%.16e\n", r);
printf("%.16e\n", s);   
return 0;
}

这个想法是每个操作的结果存储在堆栈位置中,但我无法做到这一点,因为我不确定例如 fmul st2, st3 的语法是否正确。如何将每个操作存储在堆栈位置然后打印结果?

最佳答案

嗯,我想我找到了。

我编写了这段代码,在独立的 asm block 中执行操作。

int main(void)
{
double result_mult1;
double result_mult2;
double result_resta;
const double a = 43.001;
const double b = 0.00751;
const double c = 0.00000001; 
const double d = 1.4142135623730951;
const double e = 0.1;
const double f = e+e+e;	
const double g = 0.3;

__asm__ ("fldl %1;" //Carga a
		 "fldl %2;"	//Carga b
		 "fmulp;"
		 "fstl %0;" : "=m" (result_mult1) : "m" (a), "m" (b) );
		 
__asm__ ("fldl %1;" //Carga c
		 "fldl %2;" //Carga d
		 "fmulp;"
		 "fstl %0;" : "=m" (result_mult2) : "m" (c), "m" (d) );
		 
__asm__("fldl %1;" //Carga g
		"fldl %2;" //Carga f
		"fsubp;"   //Resta g con f y lo guarda en st(0)
		"fstl %0;" : "=m" (result_resta) : "m" (g), "m" (f));	

printf("%.16e\n", result_mult1);
printf("%.16e\n", result_mult2);
printf("%.16e\n", result_resta);
return 0;
}

关于c - 使用汇编器和 C 接口(interface)执行多项操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52892697/

相关文章:

c - 使用 MinGW 在静态库中未解析 RtlSecureZeroMemory

c - 从 C 中的这个 clock() 函数得到一个意想不到的答案

c++ - 如何与 libtiff 链接

assembly - IA32 组件 : lea instruction

performance - TSX 相关的 Skylake 勘误表 SKL-105 的状态如何?

c++ - 优化使函数立即返回而不是执行

assembly - 高级语言是否支持与所有硬件相关的所有汇编语言?

assembly - ARM:2 个 printfs 导致段错误

c++ - 内在示例-这里发生了什么(包括完整代码)?

performance - 英特尔内部指南 - 延迟和吞吐量