java - ifeq/ifne JVM 操作码总是分支

标签 java jvm java-bytecode-asm whitespace-language

[TL;DR:以下 JVM 字节码指令似乎不起作用:

iconst_0
istore 6
...sequential
iinc 6 1
jsr L42
...
; L42
iload 6
ifeq L53 ; Always branches!!!
astore 8
iinc 6 -1
; L53
LDC 100
ISUB     ; ERROR, returnAddress is at the top of the stack

可以找到一个测试.class here (逻辑稍微复杂一点)。如果您想详细了解为什么我会看到这些说明,请继续阅读。]

我正在编写一个针对 JVM 字节码的 Whitespace 编译器。虽然是一种深奥的语言,但 Whitespace 描述了一组有趣的堆栈机器汇编指令,它很好地映射到 JVM。

空白有标签,它们都是跳转(goto/jump-if-zero/jump-if-negative)和函数调用的目标。相关说明(名称由我给出,在规范中它们以空格、制表符和换行符的组合给出)是:

  • mark <label> : 为后面的指令设置标签
  • jump[-if-neg|-if-zero] <label> : 无条件或有条件跳转到给定标签
  • call <label> : 调用标签指向的函数
  • end <label> : 结束一个函数,返回给调用者。

我的编译器在一个类的 main 方法中输出整个 Whitespace 程序。最简单的实现方式callend正在使用 JSRRET操作码,用于实现子程序。经过JSR操作堆栈将包含一个 returnAddress应存储在变量中供以后在 end 中使用的引用.

然而,作为mark可以是 call -ed 或 jump - 进入,堆栈可能包含也可能不包含 returnAddress引用。我决定使用一个 boolean 变量(调用位,地址 6)来存储标记是如何到达的,然后测试它是否应该将堆栈顶部存储到局部变量(返回地址,地址 8)。每条指令的实现如下:

; ... initialization
iconst_0
istore 6 ; local variable #6 holds the call bit

# call
iinc 6 1 ; sets the call bit
jsr Lxxx ; jumps to the given label, pushing a returnAddress to the stack

# mark
; Lxxx
iload 6       ; loads the call bit
ifeq Lxxx-end ; SHOULD jump to mark's end if the call bit is not set
; call bit is set: mark was call-ed and returnAddress is in the stack
astore 8      ; stores returnAddress to local variable #8
iinc 6 -1     ; resets the call bit
; Lxxx-end

# end
ret 8 ; returns using the stored returnAddress

问题:ifeq总是分支。我还尝试反转逻辑(调用位 -> 跳转位,ifeq->ifne),甚至简单地切换到 ifne (这是错误的)......但是 if 总是分支到最后。通话后,returnAddress留在堆栈中,下一个操作爆炸。

我已经使用 ASM 的分析器来观察堆栈来调试所有这些,但是只是断言了这种行为并且找不到我做错了什么。我的一个怀疑是 iinc 还有更多内容, 或 ifeq比我虚荣的哲学所能想象的还要多。我承认我只读过 instruction set pageASM's pertinent documentation对于这个项目,但我希望有人能从他们的脑海中提出一个解决方案。

In this folder有相关文件,包括可执行类和原始 Whitespace,以及 javap -c 的输出和 ASM 分析。

最佳答案

找到一个可能的原因:问题不在执行过程中,而是在验证者身上。当它看起来“总是分支”时,实际上是 validator 测试了 if 的所有可能结果,因此它可以确保堆栈看起来是一样的。我的代码依赖于一个引用 (returnAddress),可能存在也可能不存在于堆栈中,验证者无法检查它。

也就是说,示例代码不使用 -noverify 标志运行,但验证失败的其他更简单的示例确实正确执行。

关于java - ifeq/ifne JVM 操作码总是分支,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29427419/

相关文章:

java - 卡尺 : JVM throws OutOfMemoryError Exception

java - 使用 ASM 检测场突变

java - 如何使用 ASM 库将二进制指令映射回语句或表达式?

java - ASM - 拦截外部方法的字段访问

java - 转换类没有效果

java - 安卓 : faster solution to copying one file to another

Java eclipse - Activity 目录、属性修改#2

java - JSON 到 JSON 转换 | Java 模板引擎

java - 我需要使用 volatile 吗?

Java 应用程序因堆而变慢