ollama 使用 gpu 运行

说明:以 GPU 模式运行 Ollama 需要有 NVIDIA 显卡支持。

1. 安装英伟达容器安装包
我们以 Ubuntu22.04 为例(其他系统请参考:英伟达官方文档)
https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/arch-overview.html

配置apt源
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
    sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

  

更新源
sudo apt-get update

安装工具包

sudo apt-get install -y nvidia-container-toolkit


使用 GPU 运行 Ollama

docker run --gpus all -d -v /opt/ai/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama



使用 Ollama 下载模型

docker exec -it ollama ollama pull llama3:8b

  

 
posted @ 2024-05-07 08:23  🐳.城南  阅读(5541)  评论(0编辑  收藏  举报