上一页 1 2 3 4 5 6 ··· 28 下一页
摘要: DeepSeek 对 DeepSeek-V3 模型进行了多项性能测试。在知识领域,基于教育类基准测试(如 MMLU、MMLU-Pro 和 GPQA)中,DeepSeek-V3 表现优异,分别取得了 88.5、75.9 和 59.1 的高分,超越了所有其他开源模型,并在性能上接近封闭模型如 GPT-4 阅读全文
posted @ 2025-01-01 22:31 SDGVSBGDRH 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 总的来说,在预训练阶段,DeepSeek-V3 每处理 1 万亿个词元仅需 18 万小时的 H800 GPU 时间,使用配备 2048 块 H800 GPU 的集群,只需 3.7 天即可完成。整个预训练耗时不到两个月,总计使用 266.4 万 GPU 小时。此外,上下文长度扩展耗费 11.9 万 G 阅读全文
posted @ 2025-01-01 22:31 SDGVSBGDRH 阅读(27) 评论(0) 推荐(0) 编辑
摘要: “在预训练阶段,我们使用了 14.8 万亿高质量、多样化的文本对 DeepSeek-V3 进行了训练……随后,分两阶段对其上下文长度进行了扩展。”DeepSeek 在技术论文中提到,“第一阶段将上下文长度扩展到 32K,第二阶段进一步扩展到 128K。在此基础上,我们对 DeepSeek-V3 进行 阅读全文
posted @ 2025-01-01 22:30 SDGVSBGDRH 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 就在今天,素来被硅谷视为“来自东方神秘力量”的中国大模型创业公司 DeepSeek 再次悄悄惊艳了国内外的 AI 技术圈,其重磅发布了一个全新的超大规模模型——DeepSeek-V3。 这个新模型拥有 6710 亿个参数,但采用了 MOE(混合专家)架构,能根据任务需求激活特定参数,每处理一个词元激 阅读全文
posted @ 2025-01-01 22:29 SDGVSBGDRH 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 微软官方博客公布了 MS Edge 浏览器过去一年的一系列统计数字:用户完成了逾百亿次 AI 聊天;自动翻译了 38 万亿个字;休眠标签节省了 7 万亿 MB 内存;在 MSN 上每天浏览了逾 8 亿篇文章;使用 Drop 跨设备共享了 4600 万条消息和文件;Bing 日活用户逾 1.4 亿;移 阅读全文
posted @ 2024-12-31 20:09 SDGVSBGDRH 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 12 月 27 日,OpenAI 确认,美东时间 12 月 26 日周四上午 11 点整,旗下服务开始发生大规模宕机。其公布的状态页面显示,OpenAI 在 11 点整公布启动调查,称 ChatGPT、Sora 和 API 都出现高错误率,11 点 18 分确认,问题出自“上游供应商”,在监控情况。 阅读全文
posted @ 2024-12-31 20:09 SDGVSBGDRH 阅读(8) 评论(0) 推荐(0) 编辑
摘要: 在 2024 理想 AI Talk 对话节目中,理想 CEO 李想表示,“汽车将从工业时代的交通工具,进化为 AI 时代的空间机器人。电动化是过渡阶段,而 AI 才是未来竞争的核心。”李想透露,2022 年 9 月,理想汽车就确定要把 AI 作为战略核心方向,认为这是未来竞争的关键,并在 2023 阅读全文
posted @ 2024-12-31 20:09 SDGVSBGDRH 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 虽然 Rust 最近引入了 for<'a>(早期称为 use<'a>)语法,并且更早之前还加入了泛型关联类型(Generic Associated Types, GAT),但即便如此,这些工具也无法解决问题。 问题的关键在于,函数返回的 Future 类型需要依赖于参数的生命周期,而 Rust 不允 阅读全文
posted @ 2024-12-31 20:08 SDGVSBGDRH 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 第一次调用 get_mut 时,map 被借用并返回一个可能包含引用的 Option。如果返回了值,借用会立即结束;而在不返回的分支中,实际上并没有再使用借用。然而,借用检查器的流分析能力有限,无法判断这种情况。 因此,在借用检查器看来,第一次调用 get_mut 会导致 map 在整个函数的剩余部 阅读全文
posted @ 2024-12-31 20:07 SDGVSBGDRH 阅读(4) 评论(0) 推荐(0) 编辑
摘要: 通常情况下,你可能更倾向于返回 &str 而不是 &String,不过这里为了简单清晰,使用了 String。 Rust 一贯建议避免不必要的操作,比如在 HashMap 中重复查找键值。与其先检查值是否存在再查找(这样会多一次无意义的查询),更好的方法是直接调用 get(),它会返回一个 Opti 阅读全文
posted @ 2024-12-31 20:07 SDGVSBGDRH 阅读(3) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 28 下一页
点击右上角即可分享
微信分享提示