c++ - 如何在内部函数中使用 if 条件

标签 c++ visual-c++ compiler-optimization intrinsics

我想使用内部函数比较两个浮点变量。如果比较是真的,做点别的做点什么。我想按照正常的 if..else 条件来执行此操作。有没有办法使用内在函数?

//normal code
vector<float> v1, v2;
for(int i = 0; i < v1.size(); ++i)
if(v1[i]<v2[i])
{
    //do something
}
else
{
    //do something
)

如何使用 SSE2 或 AVX 做到这一点?

最佳答案

如果您期望 v1[i] < v2[i]几乎从不为真,几乎总是为真,或者通常长期保持不变(即使总体上可能没有特别的偏见),那么另一种技术也适用,它提供“真正的条件”(即不是“两者都做, discard one result")),这当然是一个代价,但你也可以实际跳过工作而不是仅仅忽略一些结果。

该技术相当简单,进行比较(矢量化),使用 _mm_movemask_ps 收集比较掩码,然后你有 3 个案例:

  • 所有比较都以相同的方式进行,它们都是 false ,执行适当的“做某事”代码,现在可能更容易矢量化,因为条件消失了。
  • 所有比较都以相同的方式进行,它们都是 true , 一样。
  • 混合型,使用更复杂的逻辑。根据您的需要,您可以分别检查所有位(回退到标量代码,但现在整个批处理只需 1 FP 比较),或者使用“仅迭代(未)设置位”技巧之一(很好地结合使用 bitscan 来恢复实际索引),或者有时您可以像往常一样退回到进行屏蔽和合并。

并非所有 3 种情况都总是相关的,通常你会应用它,因为谓词几乎总是以相同的方式进行,使得“所有相同”的情况之一非常罕见,以至于你可以将其与“混合”混为一谈.

这种技术绝对不是总是有用的。 “混合”的情况复杂而缓慢。快速路径必须通用且足够快,以值得测试您是否可以接受。

但它可能很有用,也许一侧非常缓慢且烦人,而分支的另一侧是很好的简单矢量化代码,相比之下不需要那么长时间。例如,慢速端可能必须对其他快速逼近的超越函数进行参数缩减,或者它可能必须在获取点积之前对某些 vector 进行归一化,或者对矩阵进行正交化,甚至可能从磁盘中获取数据。

或者,也许双方都不是很慢,但是他们从缓存中逐出彼此的数据(也许双方都是一个适合缓存的数组的循环,但数组不适合放在一起)所以无条件地这样做减慢他们两个。这可能是真的,但我还没有在野外看到它。

或者,也许一侧不能无条件地执行,做一些通常具有破坏性的事情,甚至可能是一些 IO。例如,如果您正在检查错误情况并记录它们。

关于c++ - 如何在内部函数中使用 if 条件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38006616/

相关文章:

c++ - 将 IP 地址字节转换为整数

visual-c++ - cxcore210d.dll丢失

c - 在 ARM 上的代码内切换 case 跳转表位置

swift - 是否有 swiftc 编译器优化来删除不必要的大变量?

c++ - 如何分析/跟踪已编译的 C++ 应用程序

c++ - 不能正确使用 min_element()

c++ - 午餐期间游戏的代码挑战问题

c++ - 调整 Qt 窗口大小时出现闪烁的白色区域

visual-c++ - MFC VC++ 中带有复选框的 CFileDialog

c++ - g++ -fno-enforce-eh-specs - 为什么/如何违反 C++ 标准?