背景:
sklearn是非常成熟、使用方便的机器学习算法工具包,但是其运行速度慢,只能支持CPU运行, 一直是一个诟病。
现在也出现了对sklearn中算法加速的工具包,比如thundersvm、sklearnex, 但是测试之后,加速效果十分有限。
下面提供NVIDIA开发基于GPU的cuML机器学习加速库,加速效果十分显著,下面给出比较稳定的安装方法:
1. 安装,
有多种安装方式,包括源码编译、docker等安装方法,会遇到许多坑,本人尝试多次,最终发现下面安装方法最为方便有效:
登录官网,选择适合自己服务器配置的安装方式,(https://rapids.ai/start.html#prerequisites)
我这里选择CUDA 11.4、python3.8、conda、cuML等,然后复制安装命令
conda create -n rapids-22.12 -c rapidsai -c conda-forge -c nvidia cuml=22.12 python=3.8 cudatoolkit=11.4
开始Collecting package metadata (repodata.json)过程时间会有些长,
然后安装过程中间会有两次提示需要选择是否继续Y/N, 选择Y,顺利的话,最终会出现下面信息,表明安装成功,cuML安装在rapids-22.12虚拟环境中
2. 测试,
激活环境conda activate rapids-22.12测试
(rapids-22.12) python Python 3.8.15 | packaged by conda-forge | (default, Nov 22 2022, 08:46:39) [GCC 10.4.0] on linux Type "help", "copyright", "credits" or "license" for more information. >>> import cuml >>> from cuml.svm import SVC >>>
这里cuml和cuml中的算法可以顺利导出,表明安装成功
cuML的接口使用与sklearn基本一致,使用非常方便
更多资料见:
https://cloud.tencent.com/developer/article/1606060