SDGVSBGDRH - 博客园

2025年1月1日

摘要： DeepSeek 对 DeepSeek-V3 模型进行了多项性能测试。在知识领域，基于教育类基准测试（如 MMLU、MMLU-Pro 和 GPQA）中，DeepSeek-V3 表现优异，分别取得了 88.5、75.9 和 59.1 的高分，超越了所有其他开源模型，并在性能上接近封闭模型如 GPT-4 阅读全文

posted @ 2025-01-01 22:31 SDGVSBGDRH 阅读(91) 评论(0) 推荐(0)

11.18

摘要：总的来说，在预训练阶段，DeepSeek-V3 每处理 1 万亿个词元仅需 18 万小时的 H800 GPU 时间，使用配备 2048 块 H800 GPU 的集群，只需 3.7 天即可完成。整个预训练耗时不到两个月，总计使用 266.4 万 GPU 小时。此外，上下文长度扩展耗费 11.9 万 G 阅读全文

posted @ 2025-01-01 22:31 SDGVSBGDRH 阅读(79) 评论(0) 推荐(0)

11.15

摘要： “在预训练阶段，我们使用了 14.8 万亿高质量、多样化的文本对 DeepSeek-V3 进行了训练……随后，分两阶段对其上下文长度进行了扩展。”DeepSeek 在技术论文中提到，“第一阶段将上下文长度扩展到 32K，第二阶段进一步扩展到 128K。在此基础上，我们对 DeepSeek-V3 进行阅读全文

posted @ 2025-01-01 22:30 SDGVSBGDRH 阅读(71) 评论(0) 推荐(0)

11.14

摘要：就在今天，素来被硅谷视为“来自东方神秘力量”的中国大模型创业公司 DeepSeek 再次悄悄惊艳了国内外的 AI 技术圈，其重磅发布了一个全新的超大规模模型——DeepSeek-V3。这个新模型拥有 6710 亿个参数，但采用了 MOE（混合专家）架构，能根据任务需求激活特定参数，每处理一个词元激阅读全文

posted @ 2025-01-01 22:29 SDGVSBGDRH 阅读(31) 评论(0) 推荐(0)

2024年12月31日

11.13

摘要：微软官方博客公布了 MS Edge 浏览器过去一年的一系列统计数字：用户完成了逾百亿次 AI 聊天；自动翻译了 38 万亿个字；休眠标签节省了 7 万亿 MB 内存；在 MSN 上每天浏览了逾 8 亿篇文章；使用 Drop 跨设备共享了 4600 万条消息和文件；Bing 日活用户逾 1.4 亿；移阅读全文

posted @ 2024-12-31 20:09 SDGVSBGDRH 阅读(31) 评论(0) 推荐(0)

11.12

摘要： 12 月 27 日，OpenAI 确认，美东时间 12 月 26 日周四上午 11 点整，旗下服务开始发生大规模宕机。其公布的状态页面显示，OpenAI 在 11 点整公布启动调查，称 ChatGPT、Sora 和 API 都出现高错误率，11 点 18 分确认，问题出自“上游供应商”，在监控情况。阅读全文

posted @ 2024-12-31 20:09 SDGVSBGDRH 阅读(59) 评论(0) 推荐(0)

11.11

摘要：在 2024 理想 AI Talk 对话节目中，理想 CEO 李想表示，“汽车将从工业时代的交通工具，进化为 AI 时代的空间机器人。电动化是过渡阶段，而 AI 才是未来竞争的核心。”李想透露，2022 年 9 月，理想汽车就确定要把 AI 作为战略核心方向，认为这是未来竞争的关键，并在 2023 阅读全文

posted @ 2024-12-31 20:09 SDGVSBGDRH 阅读(33) 评论(0) 推荐(0)

11.8

摘要：虽然 Rust 最近引入了 for<'a>（早期称为 use<'a>）语法，并且更早之前还加入了泛型关联类型（Generic Associated Types, GAT），但即便如此，这些工具也无法解决问题。问题的关键在于，函数返回的 Future 类型需要依赖于参数的生命周期，而 Rust 不允阅读全文

posted @ 2024-12-31 20:08 SDGVSBGDRH 阅读(17) 评论(0) 推荐(0)

11.7

摘要：第一次调用 get_mut 时，map 被借用并返回一个可能包含引用的 Option。如果返回了值，借用会立即结束；而在不返回的分支中，实际上并没有再使用借用。然而，借用检查器的流分析能力有限，无法判断这种情况。因此，在借用检查器看来，第一次调用 get_mut 会导致 map 在整个函数的剩余部阅读全文

posted @ 2024-12-31 20:07 SDGVSBGDRH 阅读(39) 评论(0) 推荐(0)

11.6

摘要：通常情况下，你可能更倾向于返回 &str 而不是 &String，不过这里为了简单清晰，使用了 String。 Rust 一贯建议避免不必要的操作，比如在 HashMap 中重复查找键值。与其先检查值是否存在再查找（这样会多一次无意义的查询），更好的方法是直接调用 get()，它会返回一个 Opti 阅读全文

posted @ 2024-12-31 20:07 SDGVSBGDRH 阅读(20) 评论(0) 推荐(0)

liyize

公告