首页
程序开发
写作辅助
多媒体
实用工具
博客
当前分类:
avx512
gcc - GCC 的 Xeon Phi Knights Corner 内在函数
assembly - 使用 ASM 发出屏蔽 vmovapd (AVX-512) 指令的正确方法是什么?
c++ - 如何进行手动代码矢量化,其性能优于边缘检测的自动矢量化
c - 2 个 AVX-512 vector 元素的交错合并 - C 内在函数
c++ - 将 32 位整数的 vector 相乘,仅取高 32 位
simd - 哪个更好? mask_compress + store 或 mask_compressstoreu
x86 - DY 和 DZ 伪指令在 NASM 中如何工作?
performance - intel -03会将成对的__m256d指令转换为__m512d
x86 - AVX512 比较和交换
c++ - 反转 __m512i 寄存器中的值
visual-studio - AVX512 和 MSVC 预处理器符号
performance - 使用MKL时AVX2和AVX512没有太大区别?
c++ - 查找 boost 多精度 uint512_t 的第一组指令 (ffs)
c++ - 在 GCC/CLang 自动矢量化中强制对齐加载/存储的对齐属性
simd - 为什么AVX512中有重复的置零功能?
c++ - 覆盖 SVML 的函数调用
avx512编译错误,是GCC问题吗?
x86 - AVX-512 浮点比较和屏蔽
assembly - 为什么添加 vmovapd 指令可以使 simd 矢量化代码运行得更快?
scala - 使用 Intel AVX 和 Spark
«
1
2
3
4
5
6
»
热门标签:
编程
数据结构与算法
其他