2020 年 8月 20 日随笔档案 - _Meditation

2020年8月20日

摘要：之前对bert轻量化，显存占用减少一半。但是推理速度仍然没多大变化。因此计划通过tensorRT完成模型的推理加速。轻量化之前链接： https://www.cnblogs.com/dhName/p/12628828.html 1. 首先，了解一下tensorTR是干什么的，这篇文章写得很好。阅读全文

posted @ 2020-08-20 22:00 _Meditation 阅读(1596) 评论(0) 推荐(0) 编辑

Meditation

埋滴忒深

公告