c++ - 如何从C++动态调用汇编函数?

标签 c++ assembly dynamic linker

要求:对于某些项目,我们有独特的要求。该应用程序支持一种表达式语言,该语言允许用户定义自己的复杂表达式,这些表达式可以在运行时(每秒数百次)求值,并且需要在计算机级别执行才能提高性能。

工作:我们的表达式解析器将脚本完美地转换为相应的汇编语言例程。我们通过静态链接用我们的C测试程序生成的目标文件进行了检查,它们产生了正确的结果。
由于客户端可以随时更改脚本,因此我们的程序(在运行时)检测到更改,并调用解析器,该解析器生成相应的汇编例程。然后,我们从后端调用汇编器以创建目标代码。

问题

How can we call this assembly routine dynamically from the C++ program (Loader)?



我们不应该调用C++编译器将其与加载器链接,因为加载器已经在运行其他子例程,并且我们无法卸载该加载器,重新编译然后执行新的加载器程序。

我尝试在线搜索解决方案,但是每次结果都被.NET程序集动态调用所困扰。我们的应用程序与.NET无关。

最佳答案

首先,“生成的plugin ”方法(在Linux上;我的回答集中在Linux上,但可以花点力气适应Windows;您可以使用多种平台框架,例如QtPOCOGTK的Glib;然后包装所有包装插件可以在Windows,Linux,MacOSX和Android上使用的通用API的àdlopen功能):

  • 在某些文件/tmp/generated01.c中生成C(或汇编)代码(您甚至可以使用标准C++容器生成C++代码,但其编译速度会大大降低;请注意name mangling,因此请发出并使用extern "C"函数;请阅读C++ dlopen mini HowTo)。请参阅this answer解释为什么生成C值得(比生成汇编代码更好,并且更可移植)。
  • 通过运行fork命令(使用execve + waitpid + system或简称/tmp/genenerated01.so)将生成的文件编译为共享对象gcc -fPIC -Wall -O /tmp/generated01.c -shared -o /tmp/generated01.so;您实际上需要获取position-independent code,因此需要-fPIC标志。如果在生成的汇编代码上使用dlopen,则需要改进汇编生成器以发出PIC代码。
  • dlopen表示新的/tmp/generated01.so(因此请使用dynamic linker),请参见dlopen(3);您甚至可以remove现在无用的生成的C文件/tmp/generated01.c
  • dlsym相关符号以获取指向所生成代码的函数指针,请参见dlsym(3);您的应用程序将使用这些函数指针简单地调用生成的代码。
  • 当您确定自己不需要任何功能并且没有调用框架使用它时,可以dlclose共享对象库(但是您可能会完全不调用dlclose而接受泄漏某些地址空间)

  • 上面的方法是值得的,并且可以使用很多次(我的manydl.c演示了您可以dlopen一百万个不同的共享对象),并且实际上甚至与交互式Read-Eval-Print-Loop兼容(即使发出C代码!)台式机,笔记本电脑和服务器-由于大多数情况下生成的/tmp/generated01.c会很小(例如最多几百行),因此可以非常快速地生成和编译(通过gcc等)。我什至在MELT中将其用于REPL模式。在Linux上,此插件方法通常需要将主应用程序与-rdynamic链接(以便dlopen编码的插件可以引用和调用主应用程序中的函数)。

    然后,其他方法可能是使用一些Just-In-Time compilation,例如
  • GNU lightning(发出非常慢的机器代码-发出非常短的JIT时间,但由于未优化,因此生成的代码运行缓慢)
  • asmjit;它特定于x86-64,并且使您能够生成单独的x86-64机器指令
  • GNU libjit可用于多个平台,并为其他平台提供“解释器”模式
  • LLVM(Clang/LLVM编译器的一部分,可用作JIT库)
  • GCCJIT(GCC的新JIT库前端)

  • 概括地说,该列表的第一个元素能够相当快地发出JIT机器代码,但该代码的运行速度不及gcc -fPIC -O1-O2等效的生成C代码的编译速度(但运行速度通常慢2到5倍!)。 ;最后两个元素(LLVM和GCCJIT)是基于编译器的:因此它们能够优化并发出有效的代码,但会降低JIT代码的发出速度。所有的JIT库都能够(如dlsym的插件一样)为新的JIT构造的函数提供函数指针。

    注意,需要进行权衡:如果您接受所生成的代码稍后再缓慢运行,则某些技术可以快速生成某些机器代码;其他技术(尤其是GCCJIT或LLVM)正在花费时间来优化生成的机器代码,因此花费了更多的时间来发出机器代码,但是该代码以后会很快运行。您不应期望两者都有(生成时间短,执行时间短),因为没有免费的午餐之类的东西。

    我相信手动生成一些汇编代码实际上不值得。您将无法生成非常优化的代码(因为optimization是一种非常difficult的艺术,并且GCC和Clang都有数百万条用于优化过程的源代码),除非您为此花费了很多年的工作。使用某些JIT库更容易,并且“编译”为C或C++也非常容易(将优化的负担留给了要调用的C编译器)。

    您还可以考虑使用homoiconicitymetaprogramming能力(例如multi-stage programming)将重写为某种语言,例如Common Lisp(以及许多其他功能,例如提供eval的语言)。它的SBCL实现总是发出机器代码...

    您还可以在应用程序中嵌入解释器,例如Lua-甚至LuaJit-或Guile。嵌入现有语言的主要优点是,存在着资源(书籍,模块等)和一群了解它们的人(设计好语言是很困难的!)。另外,嵌入式解释器库的设计很好,调试可能很好(由于使用了很多),其中一些解释器足够快(由于使用了bytecode技术)。

    关于c++ - 如何从C++动态调用汇编函数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31686115/

    相关文章:

    c++ - 为标准 vector 对象重载运算符 [] 时出错

    assembly - 如何编辑可执行文件

    assembly - xor [si], si 在 asm x86 中做什么?

    javascript - Sweet Alert 2 中的 Vue.js 动态 HTML 和 Vue 指令

    java - 异构数组的意义何在?

    c++ - 当 int 不是 int (intX_t)

    c++ - fwrite 和 write 之间的主要区别是什么?

    c - 帮忙解决一个DP问题

    c++ - 如何删除 'all duplicated ' 值?

    c - 模拟中断而不激活中断