摘要: 编译器前端将用户代码解析得到计算图 IR,并且做了一些和计算设备无关的通用优化。编译器后端做的优化就和具体的设备有关了(不同设备有不同的 allocator,不同的编程模型,比如英伟达的 CUDA),后端优化更加贴合硬件,会针对硬件特点为 IR 中的计算节点选择在硬件上的算子,然后为每个算子的输入输 阅读全文
posted @ 2023-08-06 19:02 machine_gun_lin 阅读(514) 评论(0) 推荐(0) 编辑
摘要: AI 编译器在前端经常会做一些静态分析,方便在前端做一些优化:自动微分等。 ![](https://img2023.cnblogs.com/blog/2078361/202308/2078361-20230806133909447-419423130.png) ## 中间表示(Intermediat 阅读全文
posted @ 2023-08-06 13:44 machine_gun_lin 阅读(426) 评论(0) 推荐(0) 编辑