当前分类:avx

c++ - AVX:矩阵点 vector ,但忽略对角线

c++ - C/C++ : emulating restrict keyword by copying arguments to local variables

assembly - 是否有更好的 AVX 指令来从 3 ymm 寄存器移动数据?

performance - Haswell AVX/FMA 延迟测试比英特尔指南慢 1 个周期

c++ - 如何使用 AVX 内在函数 C++ 将 3 个浮点 vector 交错到一个数组中

c - gcc:用 `-mavx -mprefer-avx128`优化单个函数

x86 - AVX2 矢量化 256 位查找表(32 个无符号字符)

c - 在 C 中使用 AVX 实现矩阵运算

sse - 使用 SSE/AVX/AVX2 检查 __m128i 的所有字节是否与单个字节匹配

assembly - 从 XMM 迁移到 YMM

c - 将 __m256 拆分为两个 __m128 寄存器

x86 - AVX 和 AVX2 的区别

intel - 以原子方式比较 2 个 64 位整数所需的最低 SSE/AVX 版本?

performance - AVX mat4 inv 实现比 SSE 慢

simd - 找到绝对最小值的最短方法。两个数字并将其乘以其在 AVX 中的输入符号

.net-core - SSE 和 AVX 的 MoveMask 的目的是什么

c++ - AVX intrinsic _mm256_rsqrt_ps 的相对误差比根据 intrinsics guide 应该有的要大得多

sse - 使用 AVX/AVX2/SSE __m128i 将所有负字节设置为 -128 (0x80) 并保留所有其他字节

gcc - _mm256_fmadd_ps 比 _mm256_mul_ps + _mm256_add_ps 慢?

visual-c++ - visual studio编译代码时arch参数如何使用?

热门标签: