首页
程序开发
写作辅助
多媒体
实用工具
博客
当前分类:
avx
c - AVX 加载指令在 cygwin 上失败
c - 使用 AVX 的平铺矩阵乘法
c - 如何取__m256的高音部分
c - 通过使用 AVX 内在函数重写来提高 math.h 函数的性能
intrinsics - 将每个 AVX 32 位元素的低 16 位存储到内存
c++ - avx2 8 浮点寄存器上的水平最小值并随机排列配对寄存器
x86 - 英特尔内在函数指南相对错误定义
C++ 编译器为 AVX SIMD 代码中从自身减去 +-Infinity 或 +-NaN 的恒定传播给出不同的 NaN 符号
x86 - _mm256_testz_pd 不工作?
c - 加速牛顿法求 n 次根的速度
assembly - 我应该使用哪些 AVX 寄存器来避免 3 字节 VEX 前缀?
c++ - 内在代码优化提示
c++ - 将SSE矩阵 vector 乘法代码转换为AVX
x86 - 带增量的 AVX 加载指令
image-processing - SIMD 像素对比度 : sum of differences between a pixel and its neighbors (uint16_t color components, 浮点总和)?
c++ - Visual Studio 2010 - 2015 不使用 ymm* 寄存器进行 AVX 优化
将 uint64_t 数组转换为 __m256i
c++ - 有没有办法用 AVX2 编写 _mm256_shldi_epi8(a,b,1) ? ( vector 之间每 8 位元素移动一位)
c - 在 VS 2017 中编写管道优化的 C AVX 代码
c - Vanilla C 下降替代英特尔内在函数?
«
1
2
3
4
5
6
»
热门标签:
编程
数据结构与算法
其他