我想使用内部函数比较两个浮点变量。如果比较是真的,做点别的做点什么。我想按照正常的 if..else 条件来执行此操作。有没有办法使用内在函数?
//normal code
vector<float> v1, v2;
for(int i = 0; i < v1.size(); ++i)
if(v1[i]<v2[i])
{
//do something
}
else
{
//do something
)
如何使用 SSE2 或 AVX 做到这一点?
最佳答案
如果您期望 v1[i] < v2[i]
几乎从不为真,几乎总是为真,或者通常长期保持不变(即使总体上可能没有特别的偏见),那么另一种技术也适用,它提供“真正的条件”(即不是“两者都做, discard one result")),这当然是一个代价,但你也可以实际跳过工作而不是仅仅忽略一些结果。
该技术相当简单,进行比较(矢量化),使用 _mm_movemask_ps
收集比较掩码,然后你有 3 个案例:
- 所有比较都以相同的方式进行,它们都是
false
,执行适当的“做某事”代码,现在可能更容易矢量化,因为条件消失了。 - 所有比较都以相同的方式进行,它们都是
true
, 一样。 - 混合型,使用更复杂的逻辑。根据您的需要,您可以分别检查所有位(回退到标量代码,但现在整个批处理只需 1 FP 比较),或者使用“仅迭代(未)设置位”技巧之一(很好地结合使用 bitscan 来恢复实际索引),或者有时您可以像往常一样退回到进行屏蔽和合并。
并非所有 3 种情况都总是相关的,通常你会应用它,因为谓词几乎总是以相同的方式进行,使得“所有相同”的情况之一非常罕见,以至于你可以将其与“混合”混为一谈.
这种技术绝对不是总是有用的。 “混合”的情况复杂而缓慢。快速路径必须通用且足够快,以值得测试您是否可以接受。
但它可能很有用,也许一侧非常缓慢且烦人,而分支的另一侧是很好的简单矢量化代码,相比之下不需要那么长时间。例如,慢速端可能必须对其他快速逼近的超越函数进行参数缩减,或者它可能必须在获取点积之前对某些 vector 进行归一化,或者对矩阵进行正交化,甚至可能从磁盘中获取数据。
或者,也许双方都不是很慢,但是他们从缓存中逐出彼此的数据(也许双方都是一个适合缓存的数组的循环,但数组不适合放在一起)所以无条件地这样做减慢他们两个。这可能是真的,但我还没有在野外看到它。
或者,也许一侧不能无条件地执行,做一些通常具有破坏性的事情,甚至可能是一些 IO。例如,如果您正在检查错误情况并记录它们。
关于c++ - 如何在内部函数中使用 if 条件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38006616/