assembly - 我应该使用哪些 AVX 寄存器来避免 3 字节 VEX 前缀?

标签 assembly 64-bit des avx yasm

我目前正在致力于 x64 的 Bitslice DES 实现,我想知道如何使用以下 AVX 指令尽可能避免 3 字节 VEX 前缀:

vpor
vpxor
vpand
vpandn

有人告诉我应该尽可能使用 2 字节 VEX 前缀而不是 3 字节前缀,以使代码更小、更快,但我不知 Prop 体该怎么做。我在某处读到我应该使用 xmm[0-7] 而不是 xmm[89] 和 xmm1[0-5],但我不知道哪些操作数组合会给我 2 字节 VEX 前缀而不是 3-字节的。这些指令与 2 或 3 个操作数一起使用,如以下代码片段所示:

%macro sbox1 4
vmovdqa xmm7,  xmm4
vpandn  xmm4,  xmm0
vpor    xmm10, xmm5,  xmm2
vpxor   xmm13, xmm2,  xmm0
vpxor   xmm11, xmm5,  xmm7
vpxor   xmm14, xmm4,  xmm3
vpandn  xmm12, xmm13, xmm11
vpand   xmm13, xmm10
vpxor   xmm15, xmm11, xmm2
vpxor   xmm8,  xmm13, xmm3
vpandn  xmm9,  xmm14, xmm8
vpor    xmm13, xmm5
vpor    xmm5,  xmm0
vpandn  xmm8,  xmm7
vpandn  xmm15, xmm14
vpxor   xmm13, xmm15
vpor    xmm6,  xmm5,  xmm13
vpandn  xmm5,  xmm3
vpandn  xmm15, xmm9,  xmm13
vmovdqa xmm3,  xmm8 
vpxor   xmm8,  xmm6
vpxor   xmm5,  xmm3
vpand   xmm13, xmm10
vpandn  xmm4,  xmm2
vpxor   xmm2,  xmm6,  xmm14
vpxor   xmm6,  xmm10
vpandn  xmm4,  xmm2
vpxor   xmm2,  xmm4,  pnot
vpxor   xmm4,  xmm11
vpxor   xmm13, xmm2
vpor    xmm4,  xmm3
vpandn  xmm2,  xmm1,  xmm8
vpor    xmm14, xmm7
vpxor   xmm4,  xmm10
vpor    xmm9,  xmm1
vpxor   xmm2,  xmm13
vpxor   xmm4,  xmm0
vpxor   xmm13, xmm4
vpxor   xmm9,  xmm13
vpor    xmm5,  xmm12
vpxor   xmm9,  %1

vmovdqa %1,    xmm9
vpor    xmm6,  xmm5
vpor    xmm13, xmm11
vpxor   xmm6,  xmm4
vpor    xmm0,  xmm1,  xmm15
vpxor   xmm13, xmm6
vpxor   xmm2,  %3
vmovdqa %3,    xmm2
vpxor   xmm13, %2
vpand   xmm4,  xmm15
vpandn  xmm6,  xmm14
vpxor   xmm13, xmm0
vmovdqa %2,    xmm13
vpxor   xmm4,  xmm6
vpor    xmm4,  xmm1
vpxor   xmm4,  xmm5
vpxor   xmm4,  %4
vmovdqa %4,    xmm4
%endmacro

最佳答案

您应该坚持使用寄存器xmm0...xmm7。对于通用寄存器来说也是如此,涉及eax,ebx...ebp的指令编码大多数时候比使用r8d...r15d的指令短一个字节>.

关于assembly - 我应该使用哪些 AVX 寄存器来避免 3 字节 VEX 前缀?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19016174/

相关文章:

wcf - 在 Windows 2008 R2 64 位和 WCF 上运行 Oracle

c++ - 这是确定性的步调一致吗?

python - 如何在 ECB 模式下解密 3DES(使用单词列表)?

java - java 中的 perl CBC DES 等效项

组装我们需要结局吗?

汇编立即值

assembly - 操作码 '89' 的 x86 Modrm/Sib/位移字节

c++ - 在 C++ 中将程序集转换为机器码

c - 将 64 位指针存储在 32 位整数中,前提是最大虚拟内存地址 <= UINT32_MAX(例如,当 RAM 大小 <= 4GB 时)

java - 使用带填充的 DES 使用提供的 key 进行加密