performance - Rust编译器会自动删除不必要的中间变量吗?

标签 performance variables optimization rust compiler-construction

有人告诉我,编译器将执行优化,以除去不必要的“中间”局部变量,以提高执行效率。
有人知道Rust是否也这样做吗?例如,考虑以下代码片段:

fn main() {
    // has four local variables
    let x = 3;
    let y = 5;
    let temp_result = x + y;
    let final_result = temp_result * 40;
    println!("The final result is: {}", final_result);
}
与下面的实现比较,该实现似乎有零个显式创建的局部变量
fn main() {
    // has no explicitly created local variables
    println!("The final result is: {}", (3+5) * 40);
}
这些会生成相同的机器代码吗?
换句话说,在给定硬编码整数输入的情况下,编译器是否“意识到”第一种实现中的四个局部变量与第二种实现等效?

最佳答案

这是测试版本的playground link。查看以 Release模式生成的程序集:

playground::main:
    pushq   %r15
    pushq   %r14
    pushq   %r12
    pushq   %rbx
    subq    $72, %rsp
    ####################### f1() here
    movl    $320, 4(%rsp) # whole function optimized to static value of 320
    #######################
    leaq    4(%rsp), %r14
    movq    %r14, 8(%rsp)
    movq    core::fmt::num::imp::<impl core::fmt::Display for i32>::fmt@GOTPCREL(%rip), %r15
    movq    %r15, 16(%rsp)
    leaq    .L__unnamed_2(%rip), %rax
    movq    %rax, 24(%rsp)
    movq    $2, 32(%rsp)
    movq    $0, 40(%rsp)
    leaq    8(%rsp), %rbx
    movq    %rbx, 56(%rsp)
    movq    $1, 64(%rsp)
    movq    std::io::stdio::_print@GOTPCREL(%rip), %r12
    leaq    24(%rsp), %rdi
    callq   *%r12
    ####################### f2() here
    movl    $320, 4(%rsp) # same as with f1()
    #######################
    movq    %r14, 8(%rsp)
    movq    %r15, 16(%rsp)
    leaq    .L__unnamed_3(%rip), %rax
    movq    %rax, 24(%rsp)
    movq    $2, 32(%rsp)
    movq    $0, 40(%rsp)
    movq    %rbx, 56(%rsp)
    movq    $1, 64(%rsp)
    leaq    24(%rsp), %rdi
    callq   *%r12
    addq    $72, %rsp
    popq    %rbx
    popq    %r12
    popq    %r14
    popq    %r15
    retq
因为返回值在您的示例中是静态已知的,所以这些功能甚至都不会出现在编译后的代码中。即使定义如下函数,您实际上也会得到相同的结果:
fn f1(a: i32, b: i32, c:i32) -> i32 {
    let x = a;
    let y = b;
    let temp_result = x + y;
    let final_result = temp_result * c;
    final_result
}

fn f2(a: i32, b: i32, c: i32) -> i32 {
    (a + b) * c
}

pub fn main() {
    println!("f1() = {}", f1(3, 5, 40));
    println!("f2() = {}", f2(3, 5, 40));
}
如果在编译时不知道参数会怎样? Here's another playground,这次使用随机计算的值,并且两个函数都标记了#[inline(never)]:
playground::f1:
    leal    (%rdi,%rsi), %eax
    imull   %edx, %eax
    retq

playground::main:
    # rng initialization...

.LBB7_20:
    movl    8(%rbp,%rax,4), %ebx
    addq    $1, %rax
    movq    %rax, (%rbp)
    movl    %r15d, %edi
    movl    %r12d, %esi
    movl    %ebx, %edx
    ######################## f1() called here
    callq   playground::f1 #
    ########################
    movl    %eax, 4(%rsp)
    leaq    4(%rsp), %rax
    movq    %rax, 8(%rsp)
    movq    core::fmt::num::imp::<impl core::fmt::Display for i32>::fmt@GOTPCREL(%rip), %r13
    movq    %r13, 16(%rsp)
    leaq    .L__unnamed_3(%rip), %rax
    movq    %rax, 24(%rsp)
    movq    $2, 32(%rsp)
    movq    $0, 40(%rsp)
    leaq    8(%rsp), %rbp
    movq    %rbp, 56(%rsp)
    movq    $1, 64(%rsp)
    movq    std::io::stdio::_print@GOTPCREL(%rip), %r14
    leaq    24(%rsp), %rdi
    callq   *%r14
    movl    %r15d, %edi
    movl    %r12d, %esi
    movl    %ebx, %edx
    ######################## and again here!
    callq   playground::f1 #
    ########################
    # ...
    retq
编译器实际上已经意识到这些功能是相同的,并将它们折叠为一个定义。

关于performance - Rust编译器会自动删除不必要的中间变量吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62821542/

相关文章:

c# - 快速求幂实现

java - 在 java 中检查字符串/对象的空值?

c - 使用 const 代替变量声明的空指针

Python 错误 : local variable referenced before assignment

optimization - 您见过的最核心的优化是什么?

c++ - 访问全局数组比作为参数传递更有效?

c - 是否有检测硬件位宽的标准方法?

php - 大型数据库的高性能 PHP 相似性检查

我可以使用两级可变长度参数函数......?

java - 谷歌应用程序引擎/JDO : is there a session cache?