代码改变世界

随笔分类 -  新技术探索

DeepSeek V3 两周使用总结

2025-01-22 09:25 by 曾左, 8190 阅读, 收藏, 编辑
摘要: 2024 年 12 月 26 日,杭州深度求索人工智能基础技术研究有限公司发布 DeepSeek-V3 大模型。官方宣称:(1)基于自研的 MoE 模型和 671B 参数,在 14.8T token 上进行了预训练;(2)多项评测成绩超越了 Qwen2.5 - 72B 和 Llama - 3.1 - 阅读全文

新技术探索机制

2024-03-29 18:44 by 曾左, 186 阅读, 收藏, 编辑
摘要: 我所在的团队主要负责基础架构相关的工作,了解技术趋势,熟悉业界动态,并跟进、引进和推广适合的新技术是我们团队的一项重要职责。然而,由于团队成员的日常研发工作繁重,业余空闲时间有限,对新技术的关注往往是断断续续的。因此,我们制定了一套 "新技术探索机制",每周会抽出固定的工作时间,分工查阅各类 IT 阅读全文
点击右上角即可分享
微信分享提示