摘要: **使用张量程序抽象的目的是为了表示循环和相关的硬件加速选择,如多线程、特殊硬件指令的使用和内存访问。** # 1. 一个例子 使用张量程序抽象,我们可以在较高层的抽象制定一些与特定硬件无关的较通用的 IR 优化(计算优化)。 比如, 对于两个大小为 128×128 的矩阵 A 和 B,我们进行如下 阅读全文
posted @ 2023-08-13 12:16 machine_gun_lin 阅读(138) 评论(0) 推荐(0) 编辑