Loading

摘要: 整体上下文 # 核心代码 pe[0, :, 0::2] = torch.sin(position * div_term) # even index pe[0, :, 1::2] = torch.cos(position * div_term) # odd index 语法详解 1. 多维张量索引语法 阅读全文
posted @ 2026-02-05 21:48 SaTsuki26681534 阅读(2) 评论(0) 推荐(0)
摘要: Python中的广播机制详解 什么是广播机制? 广播(Broadcasting)是NumPy/PyTorch等科学计算库中用于处理不同形状数组之间算术运算的机制。它允许在不需要显式复制数据的情况下,对形状不同的数组进行逐元素运算。 广播的核心原则 广播遵循两个基本原则: 维度对齐:从尾部(最右边)开 阅读全文
posted @ 2026-02-05 21:42 SaTsuki26681534 阅读(3) 评论(0) 推荐(0)
摘要: 根据最新的技术趋势和企业实践,我为你系统梳理当前大模型/智能体在生产环境落地部署的完整技术栈,涵盖模型层、推理层、服务层到应用层的全链路: 一、模型层:优化与压缩技术 1. 模型量化技术(降低显存占用的核心手段) 量化方案 原理 精度损失 适用场景 推荐硬件 RTN (Round-to-Neares 阅读全文
posted @ 2026-02-03 16:09 SaTsuki26681534 阅读(9) 评论(0) 推荐(0)
摘要: Coze (中文名“扣子”) 是由字节跳动推出的 一站式AI智能体(Bot)开发与服务平台。它的核心目标是通过低代码/零代码的方式,让用户无需编写复杂代码,就能快速创建和部署AI应用。 为了方便你快速理解它和之前提到的LangChain这类编程框架的核心区别,可以看下面的对比: 维度 Coze (扣 阅读全文
posted @ 2026-01-19 20:12 SaTsuki26681534 阅读(79) 评论(0) 推荐(0)
摘要: 除了LangChain,目前业界的智能体框架选择很多,各有侧重。你可以通过下表快速了解它们的主要特点和适用场景: 框架名称 主要特点/优势 典型适用场景 开发公司/背景 AutoGen 擅长多智能体间复杂对话与协作,模块化、可测试性强 代码生成、自动调研、复杂任务拆解 微软 CrewAI 以“角色分 阅读全文
posted @ 2026-01-19 20:00 SaTsuki26681534 阅读(17) 评论(0) 推荐(0)
摘要: Qwen1.5-MoE-A2.7B是阿里巴巴通义千问团队在2024年3月开源的首个混合专家(MoE)模型。它的核心特点是:用更小的计算成本,实现了与更大模型相当的性能。 下面这个表格汇总了它的关键信息: 特性维度 具体说明 模型全称 Qwen1.5-MoE-A2.7B 发布方 阿里巴巴通义千问团队 阅读全文
posted @ 2026-01-19 19:56 SaTsuki26681534 阅读(6) 评论(0) 推荐(0)
摘要: Mistral AI是一家法国的AI公司,以其高效、开源的大语言模型闻名。下面这个表格汇总了其关键的模型系列及特点,帮你快速了解: 模型系列/名称 关键特点与定位 代表性成员 参数规模/备注 Mistral 3系列 最新旗舰系列,覆盖全场景 Mistral Large 3 (多模态、多语言)、Min 阅读全文
posted @ 2026-01-19 19:50 SaTsuki26681534 阅读(13) 评论(0) 推荐(0)
摘要: 示例 x, z = xz.chunk(2, dim=-1) 这里的xz是一个channel-last格式的张量 所以说这个语句的作用是对xz在通道维度split成两股 豆包 你想理解 x, z = xz.chunk(2, dim=-1) 这条 Python 语句中每一部分的语法含义,以及整体的执行逻 阅读全文
posted @ 2026-01-15 21:08 SaTsuki26681534 阅读(4) 评论(0) 推荐(0)
摘要: 一、PEFT库是什么? PEFT(Parameter-Efficient Fine-Tuning)是Hugging Face推出的一个轻量级库,中文直译是参数高效微调。它的核心目标是:在微调大语言模型(LLM)、视觉模型等大模型时,只更新模型的一小部分参数,而非全部参数,从而大幅降低显存占用、训练时 阅读全文
posted @ 2026-01-07 14:52 SaTsuki26681534 阅读(15) 评论(0) 推荐(0)
摘要: 问题描述 部署INT4量化版本的QWen1.5 7b模型时,最后出现了这样的报错: NameError: name ‘QuantizeConfig‘ is not defined 应该还是由于transformers、optimum和peft这几个库的版本不匹配造成的 解决: 参考:https:// 阅读全文
posted @ 2026-01-06 22:02 SaTsuki26681534 阅读(137) 评论(0) 推荐(0)