2023 年 7月 19 日随笔档案 - CV技术指南（公众号）

2023年7月19日

斯坦福博士一己之力让Attention提速9倍！FlashAttention燃爆显存，Transformer上下文长度史诗级提升

摘要：前言 FlashAttention新升级！斯坦福博士一人重写算法，第二代实现了最高9倍速提升。本文转载自新智元仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理【CV技阅读全文

posted @ 2023-07-19 22:09 CV技术指南（公众号）阅读(655) 评论(0) 推荐(0) 编辑

Transformer取代者登场！微软、清华刚推出RetNet：成本低、速度快、性能强

摘要：前言 Transformer 的训练并行性是以低效推理为代价的：每一步的复杂度为 O (N) 且键值缓存受内存限制，让 Transformer 不适合部署。不断增长的序列长度会增加 GPU 内存消耗和延迟，并降低推理速度。研究者们一直在努力开发下一代架构，希望保留训练并行性和 Transformer 阅读全文

posted @ 2023-07-19 21:49 CV技术指南（公众号）阅读(109) 评论(0) 推荐(0) 编辑

公告