随笔分类 -  人工智能大模型

摘要:LLaMA Factory 是一款开源低代码大模型微调框架,集成了业界最广泛使用的微调技术,支持通过 Web UI 界面零代码微调大模型,目前已经成为开源社区内最受欢迎的微调框架之一。项目提供了多个高层次抽象的调用接口,包含多阶段训练,推理测试,benchmark评测,API Server等,使开发 阅读全文
posted @ 2025-02-12 11:53 马铃薯1 阅读(4018) 评论(0) 推荐(0) 编辑
摘要:DeepSeek-R1本地部署配置要求 Github地址:https://github.com/deepseek-ai/DeepSeek-R1?tab=readme-ov-file 模型规模最低 GPU 显存推荐 GPU 型号纯 CPU 内存需求适用场景 1.5B 4GB RTX 3050 8GB 阅读全文
posted @ 2025-02-07 17:00 马铃薯1 阅读(4643) 评论(0) 推荐(0) 编辑
摘要:DeepSeek-R1本地部署配置要求 Github地址:https://github.com/deepseek-ai/DeepSeek-R1?tab=readme-ov-file 模型规模最低 GPU 显存推荐 GPU 型号纯 CPU 内存需求适用场景 1.5B 4GB RTX 3050 8GB 阅读全文
posted @ 2025-02-07 16:05 马铃薯1 阅读(4906) 评论(0) 推荐(2) 编辑
摘要:DeepSeek-R1本地部署配置要求 Github地址:https://github.com/deepseek-ai/DeepSeek-R1?tab=readme-ov-file 模型规模最低 GPU 显存推荐 GPU 型号纯 CPU 内存需求适用场景 1.5B 4GB RTX 3050 8GB 阅读全文
posted @ 2025-02-07 14:52 马铃薯1 阅读(2885) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示