摘要: DeepSeek 开源工作第3天 🚀 Day 3 of #OpenSourceWeek: DeepGEMM Introducing DeepGEMM - an FP8 GEMM library that supports both dense and MoE GEMMs, powering V3/ 阅读全文
posted @ 2025-02-26 15:51 bingohuang 阅读(4) 评论(0) 推荐(0) 编辑
摘要: DeepSeek 开源工作第2天 🚀 Day 2 of #OpenSourceWeek: DeepEP Excited to introduce DeepEP - the first open-source EP communication library for MoE model traini 阅读全文
posted @ 2025-02-26 15:42 bingohuang 阅读(2) 评论(0) 推荐(0) 编辑
摘要: DeepSeek 开源工作第1天 🚀 Day 1 of #OpenSourceWeek: FlashMLA Honored to share FlashMLA - our efficient MLA decoding kernel for Hopper GPUs, optimized for va 阅读全文
posted @ 2025-02-26 15:37 bingohuang 阅读(3) 评论(0) 推荐(0) 编辑
摘要: DeepSeek 在 X 上发布开源计划 🚀 Day 0: Warming up for #OpenSourceWeek! We're a tiny team @deepseek_ai exploring AGI. Starting next week, we'll be open-sourcin 阅读全文
posted @ 2025-02-26 15:08 bingohuang 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 访问地址: 线上访问:https://git.io/linux 开源社区:https://github.com/jaywcjlove/linux-command 简要介绍: Linux 命令大全搜索工具,内容包含 Linux 命令手册、详解、学习、搜集,中文解释,支持背景切换。 主要功能: 当前仓库 阅读全文
posted @ 2025-01-24 13:36 bingohuang 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 访问地址: 线上访问:https://it-tools.tech/ 开源社区:https://github.com/CorentinTh/it-tools 支持私有化部署: docker run -d --name it-tools --restart unless-stopped -p 8080: 阅读全文
posted @ 2025-01-23 16:44 bingohuang 阅读(36) 评论(0) 推荐(0) 编辑
摘要: PyTorch 作为深度学习非常重要的框架之一,在科研和开发领域有着非常广泛的使用,是我们学习和研究 LLM 必备的工具之一。 本文主要介绍三个 PyTorch 的实战案例,方便大家快速了解和体验 PyTorch。 一、PyTorch 简介 PyTorch 是一个开源的 Python 深度学习框架, 阅读全文
posted @ 2024-11-13 09:41 bingohuang 阅读(300) 评论(0) 推荐(0) 编辑
摘要: 带着问题来学习 什么是Hugging Face?它的目标是什么? Hugging Face 中包含哪些知名的预训练模型? 如果我们要在 Hugging Face 中下载 BERT,那么 只有一种版本,还是有多种版本可以选择? 每一种版本的 BERT 中,只有一种格式还是有多种格式可以适应多种下游任务 阅读全文
posted @ 2024-11-13 09:35 bingohuang 阅读(293) 评论(0) 推荐(0) 编辑
摘要: 带着问题来学习 BERT 的预训练过程是如何完成的,在预训练过程中,采用了哪两种任务? 本次实战是用 SQuAD 数据集微调 BERT, 来完成我们的问答任务,你能否用 IMDB 影评数据集来微调 BERT,改进 BERT 的结果准确率? 文章最后会公布问题的参考答案~ 一、BERT 简介 BERT 阅读全文
posted @ 2024-11-08 15:01 bingohuang 阅读(711) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示