随笔分类 - AI编译器
摘要:1、”PTQ Post Training Quantization 是训练后量化,也叫做离线量化,根据量化零点 xzero_pointxzero_point 是否为 0,训练后量化分为对称量化和非对称量化;根据数据通道顺序 NHWC(TensorFlow) 这一维度区分,训练后量化又分为逐层量化和
阅读全文
摘要:1、算子调度 2、调度空间 3、调度树 4、调度转换 参考资料:如何对算子IR表示?算子是如何分开计算和调度两部分?【AI编译器】后端优化02篇_哔哩哔哩_bilibili
阅读全文
摘要:1、基本介绍 2、什么是内存对齐? C/C++内存对齐详解 - 知乎 (zhihu.com) 3、Tensor的内存布局 参考资料: 推理引擎内存布局方式【推理引擎】Kernel优化第06篇_哔哩哔哩_bilibili
阅读全文
摘要:1、介绍一下通用的卷积过程
阅读全文
摘要:1、AI编译器架构 准备好用Caffe、Tensorflow等训练好的神经网络模型。 神经网络模型转换成Graph IR,然后经过Graph Optimizer的一系列Pass优化, 列如:图算融合、数据排布转换、内存优化、死代码消除等 接着由Graph IR转成Tensor IR,然后经过Ops
阅读全文