摘要: 开源人工智能:数字主权的基石 随着人工智能正在重塑从教育到国防的方方面面,数字主权已不再是一个长期的愿景,而是一个迫在眉睫的现实需求。 为了确保各国能够对影响其社会的人工智能系统进行治理、审核和建设,开源人工智能正成为实现自主可控、激发本土创新、重建公众信任的关键支柱。 什么是数字主权? 数字主权是指一个国家或地区具备能力,依据 阅读全文
posted @ 2025-07-01 22:33 HuggingFace 阅读(181) 评论(0) 推荐(1)
摘要: nanoVLM: 最简洁、最轻量的纯 PyTorch 视觉-语言模型训练代码库 nanoVLM 是使用纯 PyTorch 训练 你自己的视觉语言模型 (VLM) 的 最简单 方式。它是一个轻量级 工具包 ,让你可以在 免费的 Colab Notebook 上启动 VLM 训练。 我们受到了 Andrej Karpathy 的 nanoGPT 的启发,为视觉领域提供了一个类似的项 阅读全文
posted @ 2025-06-18 17:46 HuggingFace 阅读(102) 评论(0) 推荐(0)
摘要: SmolVLA: 让机器人更懂 “看听说做” 的轻量化解决方案 🧭 TL;DR 今天,我们介绍了 SmolVLA,这是一个轻量级 (450M 参数) 的开源视觉 - 语言 - 动作 (VLA) 模型,专为机器人领域设计,并且可以在消费级硬件上运行。 仅使用开源社区共享的数据集进行预训练,数据集标签为 lerobot。 SmolVLA-450M 的表现优于许多更 阅读全文
posted @ 2025-06-05 14:32 HuggingFace 阅读(507) 评论(0) 推荐(1)
摘要: 🌟 欢迎参加 Gradio & MCP 智能体主题黑客松! 准备好了吗?一场以智能体(Agent)和模型上下文协议(Model Context Protocol,简称 MCP)为核心的全球在线黑客松即将来袭! 本次活动由 Hugging Face 举办,我们将共同探索基于 Anthropic MC 阅读全文
posted @ 2025-05-28 18:51 HuggingFace 阅读(290) 评论(0) 推荐(0)
摘要: 大模型评估排障指南 | 关于可复现性 这是 大模型评估排障指南 系列文章的第三篇,敬请关注系列文章: 关于推理 关于 \(\LaTeX\) 公式解析 关于可复现性 假设你读了一篇最近的新模型技术报告,然后心血来潮想要在本机复现他们的结果,却发现根本没法复现,这是为什么? 让我们来探讨一下原因。 代码库不同 要想复现论文或报告的评估得分并 阅读全文
posted @ 2025-05-13 17:14 HuggingFace 阅读(405) 评论(0) 推荐(1)
摘要: 大模型评估排障指南 | 关于 LaTeX 公式解析 这是 大模型评估排障指南 系列文章的第二篇,敬请关注系列文章: 关于推理 关于 \(\LaTeX\) 公式解析 关于可复现性 解析 LaTeX 很难。这个问题在评估输出为 \(\LaTeX\) 的模型时经常会遇到,例如 Hugging Face 的 数学评估基准。 这个基准使用 \(\LaTeX\) 阅读全文
posted @ 2025-05-08 11:50 HuggingFace 阅读(61) 评论(0) 推荐(0)
摘要: 设计即合规: 开放AI生态中的用户数据治理实践 Hugging Face Hub 已成为 AI 协作的核心平台,托管了数万个模型、数据集以及交互式应用程序 (Space)。 在开放生态系统中,用户知情同意的管理方式与那些更 "数据饥渴" 的科技公司的封闭产品截然不同。本文将通过分析 Hugging Face Hub 平台,探讨由官方主导项目与社区 阅读全文
posted @ 2025-05-01 11:52 HuggingFace 阅读(226) 评论(0) 推荐(0)
摘要: 大模型评估排障指南 | 关于推理 这是 大模型评估排障指南 系列文章的第一篇,敬请关注系列文章: 关于推理 关于 \(\LaTeX\) 公式解析 关于可复现性 模型运行非常慢怎么办? 调整 batch size 如果你想要评估结果完全可复现 (在特定的输入 prompt 和硬件条件下),你可以把 batch size 可以设为 1。 阅读全文
posted @ 2025-04-25 15:25 HuggingFace 阅读(295) 评论(0) 推荐(1)
摘要: 让 LLM 来评判 | 技巧与提示 这是 让 LLM 来评判 系列文章的第六篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 LLM 评估模型已知偏差及缓解措施: 缺乏内部一致性:同一 prompt 输入评估模型执行多次得到的结果可能不一样 (如果 阅读全文
posted @ 2025-04-09 16:01 HuggingFace 阅读(332) 评论(0) 推荐(0)
摘要: Open R1 项目进展第三期 Open R1 项目进展第三期 本次更新带来三大突破性进展: CodeForces-CoTs 数据集: 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本,同时包含 C++ 和 Python 双语言解题方案 IOI 基准测试: 基于 2024 国际信息学奥林匹克竞赛 (IOI) 构建的全新挑 阅读全文
posted @ 2025-04-07 11:52 HuggingFace 阅读(127) 评论(0) 推荐(0)