c++ - 适用于 Windows 和 Linux 的 OpenCL 程序中的 GCN ISA 程序集

标签 c++ opencl gpu gpgpu

我需要为 AMD GPU 优化 OpenCL 程序。

我想尝试在 GCN ISA 汇编中重写一些核心 OpenCL 内核,但我必须同时支持 Windows 和 Linux。

我找到了 ROCm 平台,它看起来可以为 Linux 完成工作,但不支持 Windows。

是否有我可以用来完成此任务的工具链?

最佳答案

是的,RGA (Radeon GPU Analyzer)正是您要找的。

Version 1.4该产品的一部分在 AMD 基于 LLVM 的 Lightning 编译器(用于 ROCm 平台的 OpenCL 编译器)之上增加了对 OpenCL 的支持。

Version 2.0添加了图形用户界面。

RGA 充当离线编译器,因此您的机器不必支持 ROCm。

查看 RGA Releases page获取更多信息和下载链接。

关于c++ - 适用于 Windows 和 Linux 的 OpenCL 程序中的 GCN ISA 程序集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39415097/

相关文章:

c++ - 确定 C++ 中新运算符分配的内存大小

macos - OpenCL:如何优化缩减内核(列总和),目前 CPU 速度更快

将多个 OpenCL 缓冲区组合成一个大缓冲区

java - 将字节码转换为 OpenCL 内核的 Aparapi 类

c++ - 为什么 cv::gpu::GaussianBlur 比 cv::GaussianBlur 慢?

c++ - CUDA:查明主机缓冲区是否已固定(页面锁定)

c++ - 如何使用 gmock 框架在 C++ 单元测试中模拟 fork 和 execlp 系统调用?

c++ - GDI 打印的 MSDN 示例中缺少文件

c++ - C++ 中 BranchCallbackI 的问题与音乐会

c++ - 在 CUDA 中高效评估索引映射函数