intel - 了解 Intel Intrinsics Guide 中的代码示例

我正在尝试了解 _mm256_permute2f128_ps() 的作用，但无法完全理解 intel's code-example .

DEFINE SELECT4(src1, src2, control) {
    CASE(control[1:0]) OF
    0:  tmp[127:0] := src1[127:0]
    1:  tmp[127:0] := src1[255:128]
    2:  tmp[127:0] := src2[127:0]
    3:  tmp[127:0] := src2[255:128]
    ESAC
    IF control[3]
        tmp[127:0] := 0
    FI
    RETURN tmp[127:0]
}
dst[127:0] := SELECT4(a[255:0], b[255:0], imm8[3:0])
dst[255:128] := SELECT4(a[255:0], b[255:0], imm8[7:4])
dst[MAX:256] := 0

具体的我不懂:

imm8[3:0] 符号。他们将其用作 4 字节掩码吗？ But I've seen people invoke _mm256_permute2f128_pd(myVec, myVec, 5)，其中 imm8 用作数字(数字 5)。
在SELECT4 函数中，control[1:0] 是什么意思？控件是字节掩码还是用作数字？它由多少字节组成？
为什么 IF control[3] 在 intel 的例子中使用。它不会撤消 CASE 中的选择 3: 吗？为什么我们要将 tmp[127 to 0] 设置为零，如果我们一直在输出它？

最佳答案

在这种情况下，[x:y] 符号始终指代位号。例如，如果您将 5 作为 imm8 参数传递，则(因为 5==0b00000101)imm8[3:0]==0b0101==5，如果它作为 control 传递给 SELECT4 宏，您将得到 control[3]==0==false 和 控制[1:0]==0b01==1。 control[2] 位将被忽略。

全面评估这个，你得到

dst[127:0]   := SELECT4(a[255:0], b[255:0], 5) == a[255:128]
dst[255:128] := SELECT4(a[255:0], b[255:0], 0) == a[127:0]

这意味着这将切换 a 寄存器的上半部分和下半部分并将其存储到 dst 寄存器中。

dst[MAX:256] := 0 仅与具有较大寄存器的架构相关(如果您有 AVX-512)，即，它将位 255 以上的所有内容设置为零。这与传统的 SSE 指令形成对比，后者(如果在支持 AVX 的 CPU 上执行)会使上半部分保持不变(并产生错误的依赖关系——参见 this related question)。

关于intel - 了解 Intel Intrinsics Guide 中的代码示例，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57727659/

intel - 了解 Intel Intrinsics Guide 中的代码示例

上一篇：asp.net-mvc - 我如何将 React Hooks 与 ReactJS.NET 一起使用？

下一篇：rdf - 将一个复杂的句子翻译成一组 SPO 三元组 (RDF)(可能需要具体化)