CK-Composable Kernel 下载安装 (AMD-Rocm环境)
CK-Composable Kernel 下载安装
AMD 可组合内核库:只需几行代码即可为 AI 应用提供高效的融合内核
CK 库是为 AMD-GPU 所开发的,下载和使用都需要在 AMD-Rocm 环境/平台,如果你的 GPU 并非 AMD 的,是无法下载使用 CK 的。
下载
从 GitHub 存储库下载 CK 源代码并开始构建。 将会得到一个名为composable_kernel
的文件夹。
git clone https://github.com/ROCm/composable_kernel.git cd composable_kernel
安装 (Python + Cmake)
安装Python依赖
cd docs pip3 install -r sphinx/requirements.txt python3 -m sphinx -T -E -b html -d _build/doctrees -D language=en . _build/html
查看GPU架构
CK支持的GPU架构有 gfx908;gfx90a;gfx940;gfx941;gfx942;gfx1030;gfx1100;gfx1101;gfx1102
需要查看自己本地(或你的服务器)使用的架构,以下两行代码都可以帮助你明确你所使用的架构。
rocminfo rocm-smi
我的GPU架构是 gfx942
。因此在下面的cmake配置中,我的 GPU_TARGETS
项为 gfx942
。
使用Cmake安装
创建构建目录并进入。
mkdir build cd build
使用以下命令配置cmake, 注意路径,并把 GPU_TARGETS
项更改为你的GPU架构。
cmake \ -D CMAKE_PREFIX_PATH=/opt/rocm \ -D CMAKE_CXX_COMPILER=/opt/rocm/bin/hipcc \ -D CMAKE_BUILD_TYPE=Release \ -D GPU_TARGETS="gfx942" \ ..
构建CK库 并安装CK
make -j make -j install
示例测试
生成示例和测试
make -j examples tests
生成并运行所有示例和测试
make -j check
本文作者:北纬31是条纬线哦
本文链接:https://www.cnblogs.com/beiwei31/p/18350503
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步