macos - OpenCL:sincos 与 native_cos 和 native_sin

标签 macos opencl gpgpu trigonometry

我知道这个问题的答案取决于具体的 OpenCL 实现和硬件,但我需要在 sincos 之间进行选择。和 native_cos其次是 native_sin用于在 Mac 应用程序中使用。

哪个预计会更快?

最佳答案

您可以添加一个小型基准测试来测试超越函数的所有版本,并根据基准结果相应地更改内核字符串(例如,将 native_ 附加到 cos。)。这将需要基于事件的分析并且适合可移植性。然后,每 N 次迭代一次,如果最后一个工作台有任何错误,它可以重新工作并相应地进行细微的更改。

您甚至可以对一系列函数的排列进行基准测试(例如,第一个函数使用 native ,第二个函数使用非 native ,第一个版本中的第三个使用 native ,然后在其他 5 个版本上替代 native 性,对所有函数进行基准测试)以更好地适应管道的代码功能顺序很重要的架构。

关于macos - OpenCL:sincos 与 native_cos 和 native_sin,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23333584/

相关文章:

amazon-web-services - 类似于 Amazon Web Services Cluster GPU 实例的私有(private)云 GPU 虚拟化

java - 乘法比分支更快

python - 导入 BitTorrent Bencode 模块

linux - 来自 Mac OS X 的 ssh 连接显示 ">"提示并停留在那里

linux - MATLAB - 从 mexa64 到 mexmaci64?

c++ - 尽管安装了 ocl-icd-opencl-dev,但对 `clCreateCommandQueueWithProperties' 的 undefined reference

java - 尝试释放内存时出现 EXCEPTION_ACCESS_VIOLATION (0xc0000005)

gpgpu - 如何使用GPU加速Pymc3采样?

macos - SceneKit 从动画 SCNNode 中获取当前 SCNNode 位置

c++ - 如何在我的系统中使用 OpenCL