linux - 将在 linux 中运行汇编代码的结果重定向到文本文件

标签 linux gcc assembly printf io-redirection

我正在尝试编写一个 Python 脚本来测试我在汇编中编写的一些不同代码的输出是否符合预期输出。但是我很难将输出重定向到文件中。 我写了以下内容:

extern printf
LINUX   equ     80H     ; interupt number for entering Linux kernel
EXIT    equ     1       ; Linux system call 1 i.e. exit ()
section .data
    intfmt: db "%ld", 10, 0

segment .text
    global  main


main:
    push rax
    push rsi
    push rdi
    mov rsi, 10
    mov rdi, intfmt
    xor rax, rax
    call printf
    pop rdi
    pop rsi
    pop rax 
    call os_return      ; return to operating system


os_return:
    mov  rax, EXIT      ; Linux system call 1 i.e. exit ()
    mov  rbx, 0     ; Error code 0 i.e. no errors
    mov rcx, 5
    int  LINUX      ; Interrupt Linux kernel

然后我继续在控制台中执行以下操作:

nasm -f elf64 basic.asm
gcc -m64 -o basic basic.o
./basic

将 10 输出到屏幕。 但是,如果我输入

./basic > basic.txt
cat basic.txt

basic.txt 显示为空文件。 我的总体目标是编写一个 shell 脚本,循环遍历每个程序集文件以编译和运行该文件,然后将此脚本的输出重定向到一个文件中。但是,在我可以使用单个文件之前,我不能这样做。 我想知道这与我调用 printf 有什么关系吗?虽然我误以为 printf 写入了 STDOUT。

提前致谢!

最佳答案

您的重定向是正确的;问题一定出在您正在生成的程序集中。

调试此类问题的工具是 strace。在 strace 下运行您的程序,显示:

strace ./basic
...
mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7fa5bb8da000
write(1, "10\n", 3)                     = 3
10
write(1, "z\377n\f\377\177\0\0\0\0\0\0\0\0\0\0\202\377n\f\377\177\0\0\362\377n\f\377\177\0\0"..., 139905561665008 <unfinished ... exit status 0>

你可以清楚地看到你想要的输出,但也有一些“杂乱”的写法。那条消息来自哪里?

GDB 来拯救:

gdb  -q ./basic
Reading symbols from /tmp/basic...done.

(gdb) catch syscall write
Catchpoint 1 (syscall 'write' [1])
(gdb) r

Catchpoint 1 (call to syscall 'write'), 0x00007ffff7b32500 in __write_nocancel ()
(gdb) bt
#0  0x00007ffff7b32500 in __write_nocancel () at ../sysdeps/unix/syscall-template.S:82
#1  0x00007ffff7acd133 in _IO_new_file_write (f=0x7ffff7dd7780, data=0x7ffff7ff8000, n=3) at fileops.c:1276
#2  0x00007ffff7ace785 in new_do_write (fp=0x7ffff7dd7780, data=0x7ffff7ff8000 "10\n", to_do=3) at fileops.c:530
#3  _IO_new_do_write (fp=0x7ffff7dd7780, data=0x7ffff7ff8000 "10\n", to_do=3) at fileops.c:503
#4  0x00007ffff7accd9e in _IO_new_file_xsputn (f=0x7ffff7dd7780, data=0x601023, n=1) at fileops.c:1358
#5  0x00007ffff7a9f9c8 in _IO_vfprintf_internal (s=0x7ffff7dd7780, format=<value optimized out>, ap=0x7fffffffda20) at vfprintf.c:1644
#6  0x00007ffff7aaa53a in __printf (format=0x7ffff7ff8000 "10\n") at printf.c:35
#7  0x000000000040054f in main ()

很好,这是预期的写入调用。

(gdb) c
10

Catchpoint 1 (returned from syscall 'write'), 0x00007ffff7b32500 in __write_nocancel () at ../sysdeps/unix/syscall-template.S:82
82  in ../sysdeps/unix/syscall-template.S

这只是系统调用的返回。写成功了吗? (我们知道它确实如此,因为我们在上面看到了它的输出,但让我们确认一下。)

(gdb) p $rax
$1 = 3

很好。 Write 写出了预期的 3 个字符。

(gdb) c

Catchpoint 1 (call to syscall 'write'), 0x0000000000400577 in os_return ()

这是我们没想到的写法。从哪里来?

(gdb) bt
#0  0x0000000000400577 in os_return ()
#1  0x0000000000400557 in main ()
(gdb) disas
Dump of assembler code for function os_return:
   0x0000000000400557 <+0>: movabs $0x1,%rax
   0x0000000000400561 <+10>:    movabs $0x0,%rbx
   0x000000000040056b <+20>:    movabs $0x5,%rcx
   0x0000000000400575 <+30>:    int    $0x80
=> 0x0000000000400577 <+32>:    nop
   0x0000000000400578 <+33>:    nop
   0x0000000000400579 <+34>:    nop
   0x000000000040057a <+35>:    nop
   0x000000000040057b <+36>:    nop
   0x000000000040057c <+37>:    nop
   0x000000000040057d <+38>:    nop
   0x000000000040057e <+39>:    nop
   0x000000000040057f <+40>:    nop
End of assembler dump.
(gdb) quit

因此您的系统调用执行了 write(2) 而不是预期的 exit(2)。为什么会这样?

因为你错误地定义了EXIT:

grep 'define .*NR_exit' /usr/include/asm/unistd*.h
/usr/include/asm/unistd_32.h:#define __NR_exit                1
/usr/include/asm/unistd_32.h:#define __NR_exit_group          252
/usr/include/asm/unistd_64.h:#define __NR_exit                60
/usr/include/asm/unistd_64.h:#define __NR_exit_group          231

从上面可以看出,EXIT 在 32 位模式下应该是 1,但在 64 位模式下应该是 60。

NR_write 呢? 64位模式下是1吗?

grep 'define .*NR_write' /usr/include/asm/unistd_64.h 
#define __NR_write              1
#define __NR_writev             20

确实如此。这样我们就解决了“杂散写是从哪里来的?”谜。将 EXIT 固定为 60,并在 strace 下重新运行,我们现在看到:

...
mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7fa5bb8da000
write(1, "10\n", 3)                     = 3
10
_exit(1)                                = ?

那还是不对。我们应该调用 _exit(0),而不是 _exit(1)。查看 x86_64 ABI , 显示您的寄存器使用不正确:系统调用号应该在 %rax 中,但参数在 %rdi%rsi%rdx

解决这个问题(并删除伪造的 mov rcx, 5),我们最终从 strace 得到了想要的输出:

...
mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7fa5bb8da000
write(1, "10\n", 3)                     = 3
10
_exit(0)                                = ?

所以现在我们准备好看看上面的修复是否也解决了重定向问题。

在 strace 下重新运行,输出重定向:

strace ./basic > t
...
mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f08161eb000
_exit(0)                                = ?

很明显,我们对 write 的调用丢失了。它去哪儿了?

嗯,stdout 输出默认是行缓冲的,并且在重定向到文件时得到完全缓冲。也许我们缺少 fflush 调用?

确实,在退出之前添加对 fflush(NULL) 的调用可以解决问题:

...
mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f8afd450000
write(1, "10\n", 3)                     = 3
_exit(0)                                = ?

我希望你今天学到了一些东西(我做到了 ;-)

关于linux - 将在 linux 中运行汇编代码的结果重定向到文本文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8105804/

相关文章:

c++ - 使用GCC 4.8 : array used as initializer构建错误

assembly - ".="在 AT&T 汇编语言中意味着什么?

assembly - 什么是 callq 指令?

c++ - 全局静态对象销毁后,是否有可能调用OS计时器回调?

r - 打印前 8 列和最后 3 个非零列之一 linux/awk/sed/R

linux - 如何让 watch 命令解释 vt100 序列?

c - 对程序中的字符串进行排序 - C

c++ - 避免在 C++ 中使用默认构造函数进行初始化

c++ - __declspec bare 上的 memcpy 返回意外字节

linux - 带有使文件可执行的参数的 Bash 脚本