当前分类:avx

assembly - 是否可以使用向量指令对数组中每 3 个相邻元素求和并使它们中的每一个都等于总和?

c++11 - 使用 AVX 内在函数进行转换

assembly - 在没有AVX2的情况下,如何使用字节中的位设置ymm寄存器中的双字? (vmovmskps的倒数)

英特尔 C 编译器使用未对齐的 SIMD 移动和对齐的内存

xcode - 不能使用 AVX 内在,因为我的函数编译时不支持 'xsave'

assembly - ASM x86_64 AVX : xmm and ymm registers differences

assembly - vmovdqu在这里做什么?

simd - AVX 版本没有预期的那么快

gcc - 有没有更有效的方法将 4 个连续的 double 广播到 4 个 YMM 寄存器中?

我可以正确地比较 avx 中的零寄存器吗?

assembly - x86-64 将 long 转换为 double

sse - 如何将 __m256d 中的所有元素设置为另一个 __m256d 的第三个元素?

sse - 将 32 位 int 中打包的 8 个 4 位值零扩展到 __m256i 的英特尔矢量指令?

simd - 存储没有 AVX 到 SSE 转换惩罚的 __m256 向量的总和?

assembly - 新的 AVX 指令语法

intrinsics - 来自 AVX _m256_unpack*_ps 内在解包的意外结果

x86 - 显示向量寄存器的约定

x86 - 为新指令集开发

sse - 隐式 SSE/AVX 加载/存储和堆栈

SSE:shuffle (permutevar) 4x32 整数

热门标签: