摘要: ray 用户指南: Task ray可以使得任何函数都可以在python workers上异步执行;这种函数是ray 远程函数,它们的异步调用称为ray tasks。以下为一个例子: import ray import time # A regular Python function. def no 阅读全文
posted @ 2025-03-28 23:35 xwher 阅读(3) 评论(0) 推荐(0) 编辑
摘要: Ray core 这篇博客将介绍Ray core,这是一个强大的分布式计算框架,其中提供了一些比较重要的原语,比如tasks, actors, and objects来构建和scale分布式应用。 ray引入了针对高性能的workloads,尤其是多个GPU,实验性的api--compiled gr 阅读全文
posted @ 2025-03-28 22:52 xwher 阅读(7) 评论(0) 推荐(0) 编辑
摘要: cute 教程 04 Algorithms 在这篇博客中,我们总结对Tensor操作的interface和实现. copy cute的copy算法主要是将src的元素拷贝到dst的元素 接口和特化 一个Tensor封装了数据类型,数据位置以及编译期已知的tensor的shape和stride;因此c 阅读全文
posted @ 2025-03-28 21:54 xwher 阅读(3) 评论(0) 推荐(0) 编辑
摘要: Cute教程 03 tensor 这篇博客将描述Tensor, 它是应用layout概念的核心载体。 本质上,Tensor表示一个多维数组,Tensor排除了数组元素如何进行组织的细节以及数组元素如何存储。 一个Tensor可以通过两个模板参数描述, Engine和Layout. 数据的layout 阅读全文
posted @ 2025-03-28 21:26 xwher 阅读(2) 评论(0) 推荐(0) 编辑
摘要: GPU mode: Cutlass and FA 3 本次talk的大纲: 复习attention和FA 从高层次理解FA3算法 将算法翻译成cutlass搭建的code attention机制介绍 $$O=Softmax(QK^T)V$$ attention随着序列长度的变化是二次的scale。 阅读全文
posted @ 2025-03-28 16:43 xwher 阅读(5) 评论(0) 推荐(0) 编辑
摘要: cute 教程 02 Layout代数 cute 提供layout代数来支持layout的组合,包括如下的一些操作: Layout 函数复合 Layout product: 将layout reproduce; 简单 -> 复杂 Layout divide: 将layout划分; 划分例如数据的la 阅读全文
posted @ 2025-03-27 20:27 xwher 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 综述: LLM 量化 1. Intro 低比特量化主要是减少tensor的bit-width,可以有效减少内存以及计算需求;主要可以压缩权重, 激活值, 和梯度,使得可以在受限资源的设备上使用。 2. 低比特LLM的基础 在这一届,我们主要引入从以下三个方面讨论: low-bit 数值格式 量化粒度 阅读全文
posted @ 2025-03-23 21:02 xwher 阅读(12) 评论(0) 推荐(0) 编辑
摘要: Rust 核心 Trait 详解 1. Drop • 作用: 自定义值离开作用域时的清理逻辑 • Trait 定义: pub trait Drop { fn drop(&mut self); } • 关键点: • 自动调用,无法手动触发(可用 std::mem::drop 强制提前释放) • 用于释 阅读全文
posted @ 2025-03-22 17:57 xwher 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 我们将讨论rust中的crates和modules的概念来帮助组织项目 crates rust程序是由crates组成的,每个crate是单个库或可执行文件以及一些可选信息。 当使用cargo build --verbose来构建时,可以看到依赖信息;我们也可以在Cargo.toml中指定依赖的版本 阅读全文
posted @ 2025-03-22 10:39 xwher 阅读(7) 评论(0) 推荐(0) 编辑
摘要: rust中有两种不同的错误处理方式:panic和Result panic 这种错误是不应该出现的,这意味着程序本身有bug,例如数组访问越界等。当然也可以像println!一样显式地调用panic!()。当这些错误出现时,我们如何处理?rust提供两个方式: unwind stacks(defaul 阅读全文
posted @ 2025-03-22 09:16 xwher 阅读(2) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示