CK-Composable Kernel 下载安装 (AMD-Rocm环境)

CK-Composable Kernel 下载安装

AMD 可组合内核库:只需几行代码即可为 AI 应用提供高效的融合内核

CK 库是为 AMD-GPU 所开发的,下载和使用都需要在 AMD-Rocm 环境/平台,如果你的 GPU 并非 AMD 的,是无法下载使用 CK 的。

关于CK库

下载

从 GitHub 存储库下载 CK 源代码并开始构建。 将会得到一个名为composable_kernel的文件夹。

git clone https://github.com/ROCm/composable_kernel.git
cd composable_kernel

安装 (Python + Cmake)

安装Python依赖
cd docs
pip3 install -r sphinx/requirements.txt
python3 -m sphinx -T -E -b html -d _build/doctrees -D language=en . _build/html
查看GPU架构

CK支持的GPU架构有 gfx908;gfx90a;gfx940;gfx941;gfx942;gfx1030;gfx1100;gfx1101;gfx1102

需要查看自己本地(或你的服务器)使用的架构,以下两行代码都可以帮助你明确你所使用的架构。

rocminfo
rocm-smi

我的GPU架构是 gfx942 。因此在下面的cmake配置中,我的 GPU_TARGETS 项为 gfx942

使用Cmake安装

创建构建目录并进入。

mkdir build
cd build

使用以下命令配置cmake, 注意路径,并把 GPU_TARGETS 项更改为你的GPU架构。

cmake \
-D CMAKE_PREFIX_PATH=/opt/rocm \
-D CMAKE_CXX_COMPILER=/opt/rocm/bin/hipcc \
-D CMAKE_BUILD_TYPE=Release \
-D GPU_TARGETS="gfx942"   \
..

构建CK库 并安装CK

make -j
make -j install
示例测试

生成示例和测试

make -j examples tests

生成并运行所有示例和测试

make -j check

posted @ 2024-08-09 11:38  北纬31是条纬线哦  阅读(28)  评论(0编辑  收藏  举报