首页
程序开发
写作辅助
多媒体
实用工具
博客
当前分类:
avx
c++ - AVX:矩阵点 vector ,但忽略对角线
c++ - C/C++ : emulating restrict keyword by copying arguments to local variables
assembly - 是否有更好的 AVX 指令来从 3 ymm 寄存器移动数据?
performance - Haswell AVX/FMA 延迟测试比英特尔指南慢 1 个周期
c++ - 如何使用 AVX 内在函数 C++ 将 3 个浮点 vector 交错到一个数组中
c - gcc:用 `-mavx -mprefer-avx128`优化单个函数
x86 - AVX2 矢量化 256 位查找表(32 个无符号字符)
c - 在 C 中使用 AVX 实现矩阵运算
sse - 使用 SSE/AVX/AVX2 检查 __m128i 的所有字节是否与单个字节匹配
assembly - 从 XMM 迁移到 YMM
c - 将 __m256 拆分为两个 __m128 寄存器
x86 - AVX 和 AVX2 的区别
intel - 以原子方式比较 2 个 64 位整数所需的最低 SSE/AVX 版本?
performance - AVX mat4 inv 实现比 SSE 慢
simd - 找到绝对最小值的最短方法。两个数字并将其乘以其在 AVX 中的输入符号
.net-core - SSE 和 AVX 的 MoveMask 的目的是什么
c++ - AVX intrinsic _mm256_rsqrt_ps 的相对误差比根据 intrinsics guide 应该有的要大得多
sse - 使用 AVX/AVX2/SSE __m128i 将所有负字节设置为 -128 (0x80) 并保留所有其他字节
gcc - _mm256_fmadd_ps 比 _mm256_mul_ps + _mm256_add_ps 慢?
visual-c++ - visual studio编译代码时arch参数如何使用?
«
1
2
3
4
5
6
»
热门标签:
编程
数据结构与算法
其他