足迹

能看不尽景,始是不凡人

 

2023年5月8日

Transformer 估算 101

摘要: Transformer 估算 101 本文主要介绍用于估算 transformer 类模型计算量需求和内存需求的相关数学方法。 引言 其实,很多有关 transformer 语言模型的一些基本且重要的信息都可以用很简单的方法估算出来。不幸的是,这些公式在 NLP 社区中鲜为人知。本文的目的是总结这些 阅读全文

posted @ 2023-05-08 22:39 姚伟峰 阅读(992) 评论(0) 推荐(0) 编辑

导航