c++ - valarray 就地操作给出与临时赋值不同的结果

标签 c++ vector data-structures in-place valarray

以下程序:

#include<iostream>
#include<valarray>

using namespace std;

int main() {
  int init[] = {1, 1};

  // Example 1
  valarray<int> a(init, 2);
  // In-place assignment
  a[slice(0, 2, 1)] = a[slice(0, 2, 1)] + valarray<int>(a[slice(0, 2, 1)]) * a[0];

  for (int k = 0; k < 2; ++ k) {
    cout << a[k] << ' ';  // Outputs 2 3
  }
  cout << endl;

  // Example 2
  valarray<int> b(init, 2);
  // Temporary assignment
  valarray<int> r = b[slice(0, 2, 1)] + valarray<int>(b[slice(0, 2, 1)]) * b[0];
  b[slice(0, 2, 1)] = r;

  for (int k = 0; k < 2; ++ k) {
    cout << b[k] << ' '; // Outputs 2 2
  }
  cout << endl;
  return 0;
}

输出:

2 3
2 2

正确答案是2 2 ( <1 1> + <1 1> * 1 = <2 2> 。为什么内联版本输出不同的东西?

如果重要的话,我会这样编译:

g++ myprogram.cpp -o myprogram

输出为g++ -v是:

Using built-in specs.
COLLECT_GCC=g++
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-linux-gnu/5/lto-wrapper
Target: x86_64-linux-gnu
Configured with: ../src/configure -v --with-pkgversion='Ubuntu 5.4.0-6ubuntu1~16.04.5' --with-bugurl=file:///usr/share/doc/gcc-5/README.Bugs --enable-languages=c,ada,c++,java,go,d,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-5 --enable-shared --enable-linker-build-id --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-libstdcxx-time=yes --with-default-libstdcxx-abi=new --enable-gnu-unique-object --disable-vtable-verify --enable-libmpx --enable-plugin --with-system-zlib --disable-browser-plugin --enable-java-awt=gtk --enable-gtk-cairo --with-java-home=/usr/lib/jvm/java-1.5.0-gcj-5-amd64/jre --enable-java-home --with-jvm-root-dir=/usr/lib/jvm/java-1.5.0-gcj-5-amd64 --with-jvm-jar-dir=/usr/lib/jvm-exports/java-1.5.0-gcj-5-amd64 --with-arch-directory=amd64 --with-ecj-jar=/usr/share/java/eclipse-ecj.jar --enable-objc-gc --enable-multiarch --disable-werror --with-arch-32=i686 --with-abi=m64 --with-multilib-list=m32,m64,mx32 --enable-multilib --with-tune=generic --enable-checking=release --build=x86_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu
Thread model: posix
gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.5) 

最佳答案

首先,a[slice(0, 2, 1)]类型为slice_array<T> ,并且没有 operator+ 的过载采取slice_array<T>对象或引用作为参数。

注意可能的工作过载operator+(const valarray<T>&, const valarray<T>&)是一个函数模板,但是 slice_array<T>可以隐式转换为valarray<T> ,模板参数 T无法从 slice_array<T> 推导出来争论。

所以严格来说,你的代码会导致编译错误。事实上,Clang does .


其次,你应该知道valarray的操作有一些优化技巧。 。一种众所周知的技术是 expression templates ,这会导致您意想不到的结果。要了解它是如何工作的,让我们考虑一个重现此问题的更简单的示例:

valarray<int> a{1, 1};
a = a + a[0];
// now a is {2, 3} while {2, 2} is expected

表达式模板的关键思想是推迟表达式的计算,直到真正需要它的值,从而避免额外的临时性。

在上面的示例中,优化器可以选择优化a + a[0]的结果。成为代理对象而不是 valarray<int>暂时的。代理对象仅存储“将a[0]添加到a”的 Action (不是结果值)。

当代理对象被分配给a时,发生实际评估。从存储的操作中,优化器将选择分配 a[i] + a[0]a[i]对于每个 i 。现在,此作业中不同的评估顺序将导致不同的结果。例如,如果编译器分配 a[0] + a[0]a[0] ,然后分配 a[1] + a[0] (这里a[0]改为2)为a[1] ,意想不到的结果{2, 3}已制作完毕。

标准允许这样的代理对象存在,但似乎没有明确指定代理对象应该如何工作。我个人认为这是一个编译器错误,因为简单地评估 a[0]在赋值之前存储它的值将解决这个问题,并且性能损失很小。

关于c++ - valarray 就地操作给出与临时赋值不同的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48113627/

相关文章:

c++ - 使用 boost pp 和 mpl 编译时初始化数组

c++ - 类继承——堆叠方法

c++ - 将代码从 map<char, T> 重构为 vector<T>

algorithm - 给定一个排序的整数数组,如何从中形成二叉搜索树?

mysql - 将 JSON 存储为键值对

c++ - 在 Windows 中获取用户临时文件夹路径

c++ - boost 测试

c - 如何在 C 中编写自己的 vector 结构

c++ - 为什么仅在读取 vector 中的文件名时将文件文件名设置为点而不是?

ios - 如何在 swift 中使用带有结构的嵌套 json