performance - 即使使用 -Ofast,Swift 的字典也很慢

标签 performance swift

我在 Swift 中使用 Dictionary 实现本质上是缓存。性能远低于我的预期。我读过其他一些问题,例如 this one about array sorting这似乎表明 -Ofast 是答案(如果您准备好接受它带来的变化)。然而,即使编译 -Ofast,性能也比不上其他语言。我使用的是 Swift 版本 1.0 (swift-600.0.34.4.8)。

以下是说明问题的简化示例:

import Foundation

class Holder {
    var dictionary = Dictionary<Int, Int>()

    func store(#key: Int, value: Int) {
        dictionary[key] = value
    }
}

let holder = Holder()

let items = 5000

for (var i: Int = 0; i < 5000; i++) {
    holder.store(key: i, value: i)
}

-O3编译运行需要两秒以上:

xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -O3 Test.swift && time ./Test

real    0m2.295s
user    0m2.176s
sys     0m0.117s

使用 -Ofast 编译会产生 3-4 倍的改进:

xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -Ofast Test.swift && time ./Test

real    0m0.602s
user    0m0.484s
sys     0m0.117s

相比之下,这个 Java 实现:

import java.util.Map;
import java.util.HashMap;

public class Test {
    public static void main(String[] args) {
        Holder holder = new Holder();
        int items = 5000;
        for (int i = 0; i < items; i++) {
            holder.store(i, i);
        }
    }
}

class Holder {
    private final Map<Integer, Integer> map = new HashMap<Integer, Integer>();

    public void store(Integer key, Integer value) {
        map.put(key, value);
    }
}

又快了 6 倍:

javac Test.java && time java Test

real    0m0.096s
user    0m0.088s
sys     0m0.021s

是否仅仅是复制 Dictionary 的成本导致 Swift 表现如此糟糕?删除 Holder 并直接访问 Dictionary 会提示它是。

这段代码:

import Foundation

var dictionary = Dictionary<Int, Int>()

let items = 5000

for (var i: Int = 0; i < 5000; i++) {
    dictionary[i] = i
}

显着更快:

$ xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -O3 NoHolder.swift && time ./NoHolder

real    0m0.011s
user    0m0.009s
sys     0m0.002s

$ xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -Ofast NoHolder.swift && time ./NoHolder

real    0m0.011s
user    0m0.007s
sys     0m0.003s

虽然它提供了一个(希望如此)有趣的数据点,但在我的情况下无法直接访问字典。我还能做些什么来使当前形式的 Swift 更接近这种性能水平?

最佳答案

TL;DR 这是测试版。

我认为现在的答案只是 Swift 处于测试阶段,工具处于测试阶段,还有很多优化尚未完成。在 Obj-C 中复制您的“Holder”类示例表明,即使它在相同的 -Ofast 级别上也快得多。

@import Foundation;

@interface Holder : NSObject

@property NSMutableDictionary *dictionary;
- (void)storeValue:(NSInteger)value forKey:(NSString *)key;

@end

@implementation Holder

- (instancetype)init {
   self = [self initWithDict];
    return self;
}


- (instancetype)initWithDict {
    if (!self) {
        self = [super init];
        _dictionary = [NSMutableDictionary dictionary];
    }

    return self;
}

- (void)storeValue:(NSInteger)value forKey:(NSString *)key {
    [self.dictionary setValue:@(value) forKey:key];
}

@end

int main(int argc, const char * argv[]) {

    Holder *holder = [Holder new];

    for (NSInteger i = 0; i < 5000; i++) {
        [holder storeValue:i forKey:[NSString stringWithFormat:@"%ld", i]];
    }

}

Obj-C 正在快速推出。

time ./loop 

    real    0m0.013s
    user    0m0.006s
    sys     0m0.003s

与您给出的 NoHolder 示例在时间上的相似性很好地表明了 Obj-C 编译器正在进行多少优化。

查看 Swift 中 -O3-Ofast 级别的程序集,可以看出完成的安全检查量存在很大差异。查看 Obj-C 程序集表明,好吧,要执行的内容要少得多。因为让程序变快的关键是让它不需要做太多……

OS-X-Dos-Equis:~ joshwisenbaker$ wc -l objc.txt 
     159 objc.txt
OS-X-Dos-Equis:~ joshwisenbaker$ wc -l oFast.txt 
    3749 oFast.txt

(编辑:更新完成 Holder 类的结果。)

所以另一个有趣的问题是在类定义上使用了 @final 装饰。如果您知道您的类永远不会被子类化,那么请尝试添加这样的关键字:@final class Holder

如您所见,当以相同方式编译时,它还规范化了性能。

OS-X-Dos-Equis:~ joshwisenbaker$ swift -sdk $(xcrun --show-sdk-path --sdk macosx) -Ofast bench.swift && time ./bench

real    0m0.013s
user    0m0.007s
sys     0m0.003s

即使只使用 -O3 @final 也能发挥神奇的作用。

OS-X-Dos-Equis:~ joshwisenbaker$ swift -sdk $(xcrun --show-sdk-path --sdk macosx) -O3  bench.swift && time ./bench

real    0m0.015s
user    0m0.009s
sys 0m0.003s

同样,我认为您看到的性能差异可能归因于编译时的当前优化级别。

关于performance - 即使使用 -Ofast,Swift 的字典也很慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24476943/

相关文章:

ios - UIImageView 不会显示从 UIImagePicker 中选择的图像

ios - 我如何访问 SWRevealViewController 表单元以便我可以执行SegueWithIdentifier

ios - UIWebView全屏播放HTML5视频,触摸不再被识别

vb.net - 在 VB.Net 中,使用静态定义的常量(与等效的字符串文字相比)是否可以提高效率?

java - 用于文本生成的 Java Zipf 定律 - 太慢了

javascript - 如何使用 JQuery 高效地 append 内容

ios - 应用程序崩溃,因为发件人无法识别

swift - 如何在 swift 4.2 中解析以下动态 JSON?

c - ARM编译器中的__promise是如何提高效率的

JQuery 跨浏览器性能 : . animate() on .hover() 超过 100 个 DOM 元素