当前分类:intrinsics

c - 程序集内在执行屏蔽加载

c - 无法使用 NEON Intrinsics 加载浮点值

performance - cuda内在函数sqrtf和powf性能问题

c - 在 C 中仅存储 __m128 变量的前 2 个 float

c++ - _mm_mul_epu32 与 _mm_mul_epi32

c++ - 物理寄存器和Intel SIMD变量之间的关系?

c++ - 用于双重检查锁定的正确编译器内在函数?

x86 - 混合 32 位 Alpha channel 所需的 Intel 内在函数

c++ - 如果在 Xeon Phi 上编译时不知道循环计数,则性能会下降

gcc - GCC 的 Xeon Phi Knights Corner 内在函数

c - 如何将上位 double 浮点元素与 SSE 进行比较

c++ - SIMD/SSE : short dot product and short max value

c++ - 检查 __m128i 是否为零?

x86 - 如何使用 _mm_mul_ps 指定对齐方式

c - adcx 和 adox 的测试用例

c++ - 在单臂 neon 寄存器中有效地将 8 位数字扩展到 12 位

c - 使用 __builtin_popcount 或其他内在函数来处理 _mm256_movemask_pd 比较位图的结果?

x86 - _mm256_testc_pd、_mm256_testz_pd、_mm256_testnzc_pd 有何用途?

clang - 强制 clang 生成内在 cos

c++ - GCC avx2intrin.h(版本 X-9.2)中缺少 _mm_broadcastsd_pd

热门标签: