摘要: 之前对bert轻量化,显存占用减少一半。但是推理速度仍然没多大变化。因此 计划通过tensorRT完成模型的推理加速。 轻量化之前链接: https://www.cnblogs.com/dhName/p/12628828.html 1. 首先,了解一下tensorTR是干什么的,这篇文章写得很好。 阅读全文
posted @ 2020-08-20 22:00 _Meditation 阅读(1596) 评论(0) 推荐(0) 编辑