c++ - 如何从C++动态调用汇编函数？

要求:对于某些项目，我们有独特的要求。该应用程序支持一种表达式语言，该语言允许用户定义自己的复杂表达式，这些表达式可以在运行时(每秒数百次)求值，并且需要在计算机级别执行才能提高性能。

工作:我们的表达式解析器将脚本完美地转换为相应的汇编语言例程。我们通过静态链接用我们的C测试程序生成的目标文件进行了检查，它们产生了正确的结果。
由于客户端可以随时更改脚本，因此我们的程序(在运行时)检测到更改，并调用解析器，该解析器生成相应的汇编例程。然后，我们从后端调用汇编器以创建目标代码。

问题

How can we call this assembly routine dynamically from the C++ program (Loader)?

我们不应该调用C++编译器将其与加载器链接，因为加载器已经在运行其他子例程，并且我们无法卸载该加载器，重新编译然后执行新的加载器程序。

我尝试在线搜索解决方案，但是每次结果都被.NET程序集动态调用所困扰。我们的应用程序与.NET无关。

最佳答案

首先，“生成的plugin ”方法(在Linux上；我的回答集中在Linux上，但可以花点力气适应Windows；您可以使用多种平台框架，例如Qt或POCO或GTK的Glib；然后包装所有包装插件可以在Windows，Linux，MacOSX和Android上使用的通用API的àdlopen功能):

在某些文件/tmp/generated01.c中生成C(或汇编)代码(您甚至可以使用标准C++容器生成C++代码，但其编译速度会大大降低；请注意name mangling，因此请发出并使用extern "C"函数；请阅读C++ dlopen mini HowTo)。请参阅this answer解释为什么生成C值得(比生成汇编代码更好，并且更可移植)。

通过运行fork命令(使用execve + waitpid + system或简称/tmp/genenerated01.so)将生成的文件编译为共享对象gcc -fPIC -Wall -O /tmp/generated01.c -shared -o /tmp/generated01.so；您实际上需要获取position-independent code，因此需要-fPIC标志。如果在生成的汇编代码上使用dlopen，则需要改进汇编生成器以发出PIC代码。

dlopen表示新的/tmp/generated01.so(因此请使用dynamic linker)，请参见dlopen(3)；您甚至可以remove现在无用的生成的C文件/tmp/generated01.c

dlsym相关符号以获取指向所生成代码的函数指针，请参见dlsym(3);您的应用程序将使用这些函数指针简单地调用生成的代码。

当您确定自己不需要任何功能并且没有调用框架使用它时，可以dlclose共享对象库(但是您可能会完全不调用dlclose而接受泄漏某些地址空间)

上面的方法是值得的，并且可以使用很多次(我的manydl.c演示了您可以dlopen一百万个不同的共享对象)，并且实际上甚至与交互式Read-Eval-Print-Loop兼容(即使发出C代码!)台式机，笔记本电脑和服务器-由于大多数情况下生成的/tmp/generated01.c会很小(例如最多几百行)，因此可以非常快速地生成和编译(通过gcc等)。我什至在MELT中将其用于REPL模式。在Linux上，此插件方法通常需要将主应用程序与-rdynamic链接(以便dlopen编码的插件可以引用和调用主应用程序中的函数)。

然后，其他方法可能是使用一些Just-In-Time compilation库，例如

GNU lightning(发出非常慢的机器代码-发出非常短的JIT时间，但由于未优化，因此生成的代码运行缓慢)

asmjit;它特定于x86-64，并且使您能够生成单独的x86-64机器指令

GNU libjit可用于多个平台，并为其他平台提供“解释器”模式

LLVM(Clang/LLVM编译器的一部分，可用作JIT库)

GCCJIT(GCC的新JIT库前端)

概括地说，该列表的第一个元素能够相当快地发出JIT机器代码，但该代码的运行速度不及gcc -fPIC -O1或-O2等效的生成C代码的编译速度(但运行速度通常慢2到5倍!)。 ;最后两个元素(LLVM和GCCJIT)是基于编译器的:因此它们能够优化并发出有效的代码，但会降低JIT代码的发出速度。所有的JIT库都能够(如dlsym的插件一样)为新的JIT构造的函数提供函数指针。

注意，需要进行权衡:如果您接受所生成的代码稍后再缓慢运行，则某些技术可以快速生成某些机器代码；其他技术(尤其是GCCJIT或LLVM)正在花费时间来优化生成的机器代码，因此花费了更多的时间来发出机器代码，但是该代码以后会很快运行。您不应期望两者都有(生成时间短，执行时间短)，因为没有免费的午餐之类的东西。

我相信手动生成一些汇编代码实际上不值得。您将无法生成非常优化的代码(因为optimization是一种非常difficult的艺术，并且GCC和Clang都有数百万条用于优化过程的源代码)，除非您为此花费了很多年的工作。使用某些JIT库更容易，并且“编译”为C或C++也非常容易(将优化的负担留给了要调用的C编译器)。

您还可以考虑使用homoiconicity和metaprogramming能力(例如multi-stage programming)将重写为某种语言，例如Common Lisp(以及许多其他功能，例如提供eval的语言)。它的SBCL实现总是发出机器代码...

您还可以在应用程序中嵌入解释器，例如Lua-甚至LuaJit-或Guile。嵌入现有语言的主要优点是，存在着资源(书籍，模块等)和一群了解它们的人(设计好语言是很困难的!)。另外，嵌入式解释器库的设计很好，调试可能很好(由于使用了很多)，其中一些解释器足够快(由于使用了bytecode技术)。

关于c++ - 如何从C++动态调用汇编函数？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31686115/

c++ - 如何从C++动态调用汇编函数？

上一篇：c++ - 如何使用智能指针进行自动清理？

下一篇：c++ - C/C++ - 比较两个列表和查找缺失元素的有效方法