c - 如何用 LuaJIT 定义 C 函数?

标签 c lua luajit

这个:

local ffi = require "ffi"

ffi.cdef[[
  int return_one_two_four(){
    return 124;
  }
]]

local function print124()
  print(ffi.C.return_one_two_four())
end

print124()

抛出错误:

Error: main.lua:10: cannot resolve symbol 'return_one_two_four': The specified procedure could not be found.

我对 C 有一定的了解,想利用它的一些优点来做一些事情,但我在 LuaJIT 的 FFI 库中找不到很多示例。似乎 cdef 只用于函数声明而不是定义。如何在 C 中创建函数,然后在 Lua 中使用它们?

最佳答案

LuaJIT 是 Lua 编译器,但不是 C 编译器。您必须先将 C 代码编译到共享库中。例如用

gcc -shared -fPIC -o libtest.so test.c
luajit test.lua

与文件 test.ctest.lua如下所示。

test.c

int return_one_two_four(){
    return 124;
}

test.lua

local ffi = require"ffi"

local ltest = ffi.load"./libtest.so"

ffi.cdef[[
int return_one_two_four();
]]

local function print124()
    print(ltest.return_one_two_four())
end

print124()

Live example on Wandbox

LuaJIT 中的 JIT

在问题下的评论中,有人提到了一种解决方法,即用机器代码编写函数并让它们在 Windows 上的 LuaJIT 中执行。实际上,通过在 LuaJIT 中实现 JIT,在 Linux 中同样是可能的。在 Windows 上,您可以将操作码插入字符串,将其转换为函数指针并调用它,但由于页面限制,这在 Linux 上是不可能的。在 Linux 上,内存要么是可写的,要么是可执行的,但不能同时是两者,所以我们必须以读写模式分配一个页面,插入程序集,然后将模式更改为读-执行。为此,只需使用 Linux 内核函数来获取页面大小和映射内存。但是,即使您犯了最微小的错误,例如其中一个操作码中的拼写错误,程序也会出现段错误。我使用的是 64 位汇编,因为我使用的是 64 位操作系统。

重要提示:在您的机器上执行此操作之前,请检查 <bits/mman-linux.h> 中的魔数(Magic Number).它们在每个系统上都不相同。

local ffi = require"ffi"

ffi.cdef[[
typedef unsigned char uint8_t;
typedef long int off_t;

// from <sys/mman.h>
void *mmap(void *addr, size_t length, int prot, int flags,
           int fd, off_t offset);
int munmap(void *addr, size_t length);
int mprotect(void *addr, size_t len, int prot);

// from <unistd.h>
int getpagesize(void);
]]

-- magic numbers from <bits/mman-linux.h>
local PROT_READ     = 0x1  -- Page can be read.
local PROT_WRITE    = 0x2  -- Page can be written.
local PROT_EXEC     = 0x4  -- Page can be executed.
local MAP_PRIVATE   = 0x02 -- Changes are private.
local MAP_ANONYMOUS = 0x20 -- Don't use a file.

local page_size = ffi.C.getpagesize()
local prot = bit.bor(PROT_READ, PROT_WRITE)
local flags = bit.bor(MAP_ANONYMOUS, MAP_PRIVATE)
local code = ffi.new("uint8_t *", ffi.C.mmap(ffi.NULL, page_size, prot, flags, -1, 0))

local count = 0
local asmins = function(...)
    for _,v in ipairs{ ... } do
        assert(count < page_size)
        code[count] = v
        count = count + 1
    end
end

asmins(0xb8, 0x7c, 0x00, 0x00, 0x00) -- mov rax, 124
asmins(0xc3) -- ret

ffi.C.mprotect(code, page_size, bit.bor(PROT_READ, PROT_EXEC))

local fun = ffi.cast("int(*)(void)", code)
print(fun())

ffi.C.munmap(code, page_size)

Live example on Wandbox

如何找到操作码

我看到这个答案引起了一些兴趣,所以我想补充一些我一开始遇到困难的事情,即如何找到您要执行的指令的操作码。网上有一些资源,最著名的是 Intel® 64 and IA-32 Architectures Software Developer Manuals。但没有人愿意浏览数千页 PDF 只是为了找出如何做 mov rax, 124 .因此,有些人制作了列出指令和相应操作码的表格,例如http://ref.x86asm.net/ , 但在表中查找操作码也很麻烦,因为即使是 mov根据目标和源操作数的不同,可以有许多不同的操作码。所以我要做的是编写一个简短的汇编文件,例如

mov rax, 124
ret

你可能想知道,为什么没有函数,也没有像 segment .text 这样的东西?在我的程序集文件中。好吧,因为我不想链接它,所以我可以将所有这些都放在一边并节省一些输入。然后使用

组装它
$ nasm -felf64 -l test.lst test.s

-felf64选项告诉汇编程序我正在使用 64 位语法,-l test.lst我希望在文件 test.lst 中列出生成的代码的选项.该列表看起来类似于:

$ cat test.lst
     1 00000000 B87C000000              mov rax, 124
     2 00000005 C3                      ret

第三列包含我感兴趣的操作码。只需将它们拆分为 1 个字节的单元并将它们插入到您的程序中,即 B87C000000变成 0xb8, 0x7c, 0x00, 0x00, 0x00 (幸运的是,十六进制数字在 Lua 中不区分大小写,我更喜欢小写)。

关于c - 如何用 LuaJIT 定义 C 函数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53805913/

相关文章:

c - 交换指针而不是 memcpy

string - 在Lua中提取字符串的最后N个字符?

c - 如何使用C从注册表中读取存储在Key中的值

c++ - "lossless" float 到字节的转换

lua - 尝试索引本地 'args'(函数值)

nginx - Openresty torch 模块加载问题

c++ - ffi.C 缺少所有符号的所有声明

LuaJIT 看不到 LuaRocks 安装的岩石

c - 按字符串长度对动态分配的字符串数组进行 Qsort

避免 Lua Table Gap