05 2023 档案
摘要:MegCC 是一个真真实实的深度学习模型编译器,具备极其轻量的 Runtime 二进制体积,高性能,方便移植,极低内存使用以及快启动等核心特点。用户可在 MLIR 上进行计算图优化,内存规划,最后通过预先写好的 code 模版进行代码生成。
阅读全文
摘要:roofline 分析是一种简单评估当前计算任务对当前平台计算/访存能力的利用情况的方法,可以帮助分析算子的优化方向和优化潜力。
阅读全文
摘要:每个项目都有资深导师 1V1 指导,机会难得,不容错过!学生可自由选择项目,申请成功并完成项目即可获得 12000 元奖金。
阅读全文
摘要:欢迎试用结构简单,易上手的轻量级 LLM 模型推理框架 InferLLM
阅读全文