ollama 0.2.0 发布
就在最近ollama 0.2.0 发布了,比较重要的是支持并发处理
并发处理的特性
- 并行请求,同时处理多个chat 会话,同步的处理一个文档的多个部分,同时运行多个agent
- 多模型处理,支持RAG 场景,同时处理嵌入以及文本完成,同时运行多个agent
新模型支持
包含了GLM-4,CodeGeeX4, Gemma 2
说明
对于Gemma 2 模型的可能需要重新pull模型
就在最近ollama 0.2.0 发布了,比较重要的是支持并发处理
包含了GLM-4,CodeGeeX4, Gemma 2
对于Gemma 2 模型的可能需要重新pull模型