我在 Swift 中使用 Dictionary
实现本质上是缓存。性能远低于我的预期。我读过其他一些问题,例如 this one about array sorting这似乎表明 -Ofast
是答案(如果您准备好接受它带来的变化)。然而,即使编译 -Ofast
,性能也比不上其他语言。我使用的是 Swift 版本 1.0 (swift-600.0.34.4.8)。
以下是说明问题的简化示例:
import Foundation
class Holder {
var dictionary = Dictionary<Int, Int>()
func store(#key: Int, value: Int) {
dictionary[key] = value
}
}
let holder = Holder()
let items = 5000
for (var i: Int = 0; i < 5000; i++) {
holder.store(key: i, value: i)
}
用-O3
编译运行需要两秒以上:
xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -O3 Test.swift && time ./Test
real 0m2.295s
user 0m2.176s
sys 0m0.117s
使用 -Ofast
编译会产生 3-4 倍的改进:
xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -Ofast Test.swift && time ./Test
real 0m0.602s
user 0m0.484s
sys 0m0.117s
相比之下,这个 Java 实现:
import java.util.Map;
import java.util.HashMap;
public class Test {
public static void main(String[] args) {
Holder holder = new Holder();
int items = 5000;
for (int i = 0; i < items; i++) {
holder.store(i, i);
}
}
}
class Holder {
private final Map<Integer, Integer> map = new HashMap<Integer, Integer>();
public void store(Integer key, Integer value) {
map.put(key, value);
}
}
又快了 6 倍:
javac Test.java && time java Test
real 0m0.096s
user 0m0.088s
sys 0m0.021s
是否仅仅是复制 Dictionary
的成本导致 Swift 表现如此糟糕?删除 Holder
并直接访问 Dictionary
会提示它是。
这段代码:
import Foundation
var dictionary = Dictionary<Int, Int>()
let items = 5000
for (var i: Int = 0; i < 5000; i++) {
dictionary[i] = i
}
显着更快:
$ xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -O3 NoHolder.swift && time ./NoHolder
real 0m0.011s
user 0m0.009s
sys 0m0.002s
$ xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -Ofast NoHolder.swift && time ./NoHolder
real 0m0.011s
user 0m0.007s
sys 0m0.003s
虽然它提供了一个(希望如此)有趣的数据点,但在我的情况下无法直接访问字典。我还能做些什么来使当前形式的 Swift 更接近这种性能水平?
最佳答案
TL;DR 这是测试版。
我认为现在的答案只是 Swift 处于测试阶段,工具处于测试阶段,还有很多优化尚未完成。在 Obj-C 中复制您的“Holder”类示例表明,即使它在相同的 -Ofast
级别上也快得多。
@import Foundation;
@interface Holder : NSObject
@property NSMutableDictionary *dictionary;
- (void)storeValue:(NSInteger)value forKey:(NSString *)key;
@end
@implementation Holder
- (instancetype)init {
self = [self initWithDict];
return self;
}
- (instancetype)initWithDict {
if (!self) {
self = [super init];
_dictionary = [NSMutableDictionary dictionary];
}
return self;
}
- (void)storeValue:(NSInteger)value forKey:(NSString *)key {
[self.dictionary setValue:@(value) forKey:key];
}
@end
int main(int argc, const char * argv[]) {
Holder *holder = [Holder new];
for (NSInteger i = 0; i < 5000; i++) {
[holder storeValue:i forKey:[NSString stringWithFormat:@"%ld", i]];
}
}
Obj-C 正在快速推出。
time ./loop
real 0m0.013s
user 0m0.006s
sys 0m0.003s
与您给出的 NoHolder 示例在时间上的相似性很好地表明了 Obj-C 编译器正在进行多少优化。
查看 Swift 中 -O3
和 -Ofast
级别的程序集,可以看出完成的安全检查量存在很大差异。查看 Obj-C 程序集表明,好吧,要执行的内容要少得多。因为让程序变快的关键是让它不需要做太多……
OS-X-Dos-Equis:~ joshwisenbaker$ wc -l objc.txt
159 objc.txt
OS-X-Dos-Equis:~ joshwisenbaker$ wc -l oFast.txt
3749 oFast.txt
(编辑:更新完成 Holder 类的结果。)
所以另一个有趣的问题是在类定义上使用了 @final
装饰。如果您知道您的类永远不会被子类化,那么请尝试添加这样的关键字:@final class Holder
如您所见,当以相同方式编译时,它还规范化了性能。
OS-X-Dos-Equis:~ joshwisenbaker$ swift -sdk $(xcrun --show-sdk-path --sdk macosx) -Ofast bench.swift && time ./bench
real 0m0.013s
user 0m0.007s
sys 0m0.003s
即使只使用 -O3
@final
也能发挥神奇的作用。
OS-X-Dos-Equis:~ joshwisenbaker$ swift -sdk $(xcrun --show-sdk-path --sdk macosx) -O3 bench.swift && time ./bench
real 0m0.015s
user 0m0.009s
sys 0m0.003s
同样,我认为您看到的性能差异可能归因于编译时的当前优化级别。
关于performance - 即使使用 -Ofast,Swift 的字典也很慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24476943/