ollama 的一些参数简单说明
ollama 提供了不少配置可以方便我们进行ollama 服务的调整,比如访问端口(默认127.0.0.1),模型内存管理。。。
以下简单说明下访问以及模型内存管理的
完整配置信息
可以通过golang 代码查看,主要定义在envconfig/config.go 中
- 默认配置
func AsMap() map[string]EnvVar {
return map[string]EnvVar{
"OLLAMA_DEBUG": {"OLLAMA_DEBUG", Debug, "Show additional debug information (e.g. OLLAMA_DEBUG=1)"},
"OLLAMA_FLASH_ATTENTION": {"OLLAMA_FLASH_ATTENTION", FlashAttention, "Enabled flash attention"},
"OLLAMA_HOST": {"OLLAMA_HOST", "", "IP Address for the ollama server (default 127.0.0.1:11434)"},
"OLLAMA_KEEP_ALIVE": {"OLLAMA_KEEP_ALIVE", KeepAlive, "The duration that models stay loaded in memory (default \"5m\")"},
"OLLAMA_LLM_LIBRARY": {"OLLAMA_LLM_LIBRARY", LLMLibrary, "Set LLM library to bypass autodetection"},
"OLLAMA_MAX_LOADED_MODELS": {"OLLAMA_MAX_LOADED_MODELS", MaxRunners, "Maximum number of loaded models (default 1)"},
"OLLAMA_MAX_QUEUE": {"OLLAMA_MAX_QUEUE", MaxQueuedRequests, "Maximum number of queued requests"},
"OLLAMA_MAX_VRAM": {"OLLAMA_MAX_VRAM", MaxVRAM, "Maximum VRAM"},
"OLLAMA_MODELS": {"OLLAMA_MODELS", "", "The path to the models directory"},
"OLLAMA_NOHISTORY": {"OLLAMA_NOHISTORY", NoHistory, "Do not preserve readline history"},
"OLLAMA_NOPRUNE": {"OLLAMA_NOPRUNE", NoPrune, "Do not prune model blobs on startup"},
"OLLAMA_NUM_PARALLEL": {"OLLAMA_NUM_PARALLEL", NumParallel, "Maximum number of parallel requests (default 1)"},
"OLLAMA_ORIGINS": {"OLLAMA_ORIGINS", AllowOrigins, "A comma separated list of allowed origins"},
"OLLAMA_RUNNERS_DIR": {"OLLAMA_RUNNERS_DIR", RunnersDir, "Location for runners"},
"OLLAMA_TMPDIR": {"OLLAMA_TMPDIR", TmpDir, "Location for temporary files"},
}
}
一些配置调整
默认ollama 提供的api 服务是本地的,其他访问不方便,解决方法很有,包含了直接通过配置修改以及基于nginx proxy 的
- 配置默认的
[Service]
Environment="OLLAMA_HOST=0.0.0.0"
- 模型内存
加载模型到内存中,模型到内存中有利于快速推理,api 配置模式
curl http://localhost:11434/api/generate -d '{"model": "llama3", "keep_alive": -1}'
OLLAMA_KEEP_ALIVE 也是一个参数
[Service]
Environment="OLLAMA_KEEP_ALIVE=-1"
- 队列配置
OLLAMA_MAX_QUEUE 环境变量
[Service]
Environment="OLLAMA_MAX_QUEUE=1000"
说明
了解一些配置还是比较有用的,可以更好的进行资源使用以及调优处理
参考资料
https://github.com/ollama/ollama/blob/main/docs/api.md
https://github.com/ollama/ollama/blob/main/docs/faq.md
https://github.com/ollama/ollama/blob/main/envconfig/config.go
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
2022-07-16 dremio 当前支持的权限
2022-07-16 dremio 权限体系
2022-07-16 dremio udf 参考调用处理
2022-07-16 dremio 22 udf 功能
2022-07-16 dremio 的一些系统表
2022-07-16 dremio 22 odbc 新特性
2021-07-16 grafana 8.0 新的报警机制