会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
稳住·能赢
讲人话,都能懂。
首页
新随笔
联系
管理
2026年2月1日
Code Reader Skills — 基于认知科学的源代码深度理解工具
摘要: Code Reader Skills — 基于认知科学的源代码深度理解工具 阅读陌生开源代码时,最困难的不是逐行读,而是理解: 项目目的与背景 核心设计与逻辑 代码结构与关键模块 Code Reader Skills 是一个 agent-based skill 工具,帮助开发者快速完成首次理解: 提
阅读全文
posted @ 2026-02-01 11:43 稳住·能赢
阅读(29)
评论(2)
推荐(0)
2026年1月31日
【MLIR】Linalg的通用Fusion优化分析
摘要: 【MLIR】Linalg的通用Fusion优化分析 从宏观到微观,逐步深入理解 Linalg 的 Fusion 优化 1. Fusion 是什么? Fusion(融合) = 把多个操作合并成一个,减少中间结果的内存读写。 直观示例: 融合前: 两个操作,中间结果写内存 ┌─────────────┐
阅读全文
posted @ 2026-01-31 17:29 稳住·能赢
阅读(7)
评论(0)
推荐(0)
2026年1月28日
Graph IR vs SSA IR:为什么现代 AI 编译器离不开 SSA?
摘要: Graph IR vs SSA IR:为什么现代 AI 编译器离不开 SSA? 在编译器和 AI 编译领域,经常会听到 Graph IR 和 SSA IR。 它们并不是“新旧关系”,而是解决不同问题的两类中间表示(IR)。 本文用直观的方式解释它们的区别,以及各自适合做什么。 1. 什么是 Grap
阅读全文
posted @ 2026-01-28 18:31 稳住·能赢
阅读(3)
评论(0)
推荐(0)
【MLIR】Linalg中FusePadOpWithLinalgProducer优化分析
摘要: 【MLIR】Linalg中FusePadOpWithLinalgProducer优化分析 本文档基于MLIR 版本: 21.1.8分析,代码路径:mlir/lib/Dialect/Linalg/Transforms/FusePadOpWithLinalgProducer.cpp 1. 概述 Fuse
阅读全文
posted @ 2026-01-28 17:03 稳住·能赢
阅读(7)
评论(0)
推荐(0)
2026年1月27日
如何使用MLIR的linalg.pack实现性能大幅提升?
摘要: 如何使用MLIR的linalg.pack实现性能大幅提升? 1. 概述 1.1 什么是 linalg.pack? linalg.pack 是 MLIR Linalg dialect 中用于数据布局重排(Data Layout Relayout)的核心操作。它通过将张量的某些维度分块(tiling)并
阅读全文
posted @ 2026-01-27 17:25 稳住·能赢
阅读(12)
评论(0)
推荐(0)
如何充分发挥MLIR中Loop的优化特性?
摘要: 如何充分发挥MLIR中Loop的优化特性? 本文通过一个完整的矩阵乘法示例,讲解MLIR中三个核心Loop优化技术: Loop-carried Dependency 分析 - 识别循环间依赖 Loop Unrolling - 循环展开 Affine Loop LICM - 循环不变代码外提 场景:矩
阅读全文
posted @ 2026-01-27 16:01 稳住·能赢
阅读(9)
评论(0)
推荐(0)
如何基于MLIR实现Tile-based编程?
摘要: 如何基于MLIR实现Tile-based编程? 本文档介绍 MLIR 中的 Tiling 技术,这是优化计算性能的核心方法。即使你对 MLIR 不熟悉,也可以通过本文档学习 Tiling 的概念和用法。 目录 前置知识:MLIR 基础概念 什么是 Tiling? 示例 1:最简单的循环 Tiling
阅读全文
posted @ 2026-01-27 11:25 稳住·能赢
阅读(15)
评论(0)
推荐(0)
2026年1月24日
如何基于 MLIR 实现自动调优 (GPU & Ascend NPU)
摘要: 基于 MLIR 实现跨架构自动调优 (GPU & Ascend NPU) 扩展阅读:本指南是对《AI 编译器融合技术系统化分类》第 8.3 节“自动调优与调度分离”的深度展开。 1. 核心理念:调度与计算分离 在传统 AI 编译器(如 TVM v1)中,调度逻辑往往硬编码在 C++ 代码中。而在 M
阅读全文
posted @ 2026-01-24 15:15 稳住·能赢
阅读(7)
评论(0)
推荐(0)
如何基于 MLIR 实现代价模型驱动的融合决策机制
摘要: 如何基于 MLIR 实现代价模型驱动的融合决策机制 (GPU & Ascend NPU) 1. 背景与动机 在 AI 编译器中,算子融合(Operator Fusion) 是提升性能的关键手段,旨在通过将多个算子合并为一个内核(Kernel)来减少全局内存(HBM/DDR)的读写次数。 然而,融合并
阅读全文
posted @ 2026-01-24 15:03 稳住·能赢
阅读(10)
评论(0)
推荐(0)
MLIR中的SparseTensor方言是如何分析矩阵的稀疏性的?
摘要: 在传统编程中,CSR 通常是手动维护的三个数组(row_ptr, col_indices, values)。但在 MLIR 中,稀疏性被设计成为类型系统(Type System)的一种属性,而不是具体的数据结构实现细节。 1. CSR是什么? 在传统高性能计算和深度学习系统中,稀疏张量通常以固定格式
阅读全文
posted @ 2026-01-24 12:00 稳住·能赢
阅读(7)
评论(0)
推荐(0)
下一页
公告