这是 Efficient way to return a std::vector in c++ 的一个扩展问题
#include <cstdio>
#include <vector>
#include <chrono>
std::vector<int> func1() {
std::vector<int> v;
v.reserve(1e6);
for (int i = 0; i < 1e6; i++) v.emplace_back(i);
return v;
}
std::vector<int> func2() {
std::vector<int> v;
v.reserve(1e6);
for (int i = 0; i < 1e6; i++) v.emplace_back(i);
return std::move(v);
}
int main() {
auto start1 = std::chrono::steady_clock::now();
std::vector<int> v1 = func1();
auto end1 = std::chrono::steady_clock::now();
printf("%d\n", std::chrono::duration_cast<std::chrono::nanoseconds>(end1-start1).count());
auto start2 = std::chrono::steady_clock::now();
std::vector<int> v2 = func2();
auto end2 = std::chrono::steady_clock::now();
printf("%d\n", std::chrono::duration_cast<std::chrono::nanoseconds>(end2-start2).count());
/*
auto start3 = std::chrono::steady_clock::now();
std::vector<int> v3 = v2;
auto end3 = std::chrono::steady_clock::now();
printf("%d\n", std::chrono::duration_cast<std::chrono::nanoseconds>(end3-start3).count());
*/
return 0;
}
在方法 2 中,我明确告诉编译器我想移动而不是复制 vector ,但是多次运行代码表明方法 1 有时实际上优于方法 2,即使方法 2 获胜,也不是很多.
方法 3 一直是最好的。当我必须从函数返回时如何模拟方法 3? (不,我不能通过引用传递)
使用 gcc 6.1.0
最佳答案
方法 1 - 您正在使用 Named Return Value Optimization (NRVO)
.实际上,这是最好的,因为在优化代码中根本没有构造临时对象。如果编译器无法生成 NRVO,它将使用移动语义,与方法 2 相同。
方法 2 - 您正在有效地关闭 NRVO,并强制为目标 std::vector 移动构造函数。所以,这和方法 1 一样不好。
方法 3 - 实际上,您是在此处复制 vector ,这是迄今为止最差的性能。但是,由于您一次复制 vector (一大块内存,而不是许多位置)- 您可以获得最佳性能,但这在方法 1 或 2 的用例中是不可复制的。
NRVO 如何运作?
当您只有一个返回值时:在本例中为 std::vector<int> v
,编译器根本没有在函数内部创建这个 vector 。它创建未命名的右值 vector ,您将返回该 vector ,并将对它的引用传递给您的函数。
在优化代码中会发生这样的事情:
std::vector<int> func1(std::vector<int>& hidden) {
hidden.emplace_back(stuff);
return;
}
关于c++ - 从函数按值返回STL vector 的有效方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40780060/