CK-Composable Kernel 下载安装 (AMD-Rocm环境)
CK-Composable Kernel 下载安装
AMD 可组合内核库:只需几行代码即可为 AI 应用提供高效的融合内核
CK 库是为 AMD-GPU 所开发的,下载和使用都需要在 AMD-Rocm 环境/平台,如果你的 GPU 并非 AMD 的,是无法下载使用 CK 的。
下载
从 GitHub 存储库下载 CK 源代码并开始构建。 将会得到一个名为composable_kernel
的文件夹。
git clone https://github.com/ROCm/composable_kernel.git
cd composable_kernel
安装 (Python + Cmake)
安装Python依赖
cd docs
pip3 install -r sphinx/requirements.txt
python3 -m sphinx -T -E -b html -d _build/doctrees -D language=en . _build/html
查看GPU架构
CK支持的GPU架构有 gfx908;gfx90a;gfx940;gfx941;gfx942;gfx1030;gfx1100;gfx1101;gfx1102
需要查看自己本地(或你的服务器)使用的架构,以下两行代码都可以帮助你明确你所使用的架构。
rocminfo
rocm-smi
我的GPU架构是 gfx942
。因此在下面的cmake配置中,我的 GPU_TARGETS
项为 gfx942
。
使用Cmake安装
创建构建目录并进入。
mkdir build
cd build
使用以下命令配置cmake, 注意路径,并把 GPU_TARGETS
项更改为你的GPU架构。
cmake \
-D CMAKE_PREFIX_PATH=/opt/rocm \
-D CMAKE_CXX_COMPILER=/opt/rocm/bin/hipcc \
-D CMAKE_BUILD_TYPE=Release \
-D GPU_TARGETS="gfx942" \
..
构建CK库 并安装CK
make -j
make -j install
示例测试
生成示例和测试
make -j examples tests
生成并运行所有示例和测试
make -j check