摘要: 上一篇文章提到了模型不环保这个话题。这篇文章就这个问题展开唠叨一下。 自从BERT, GPT此类的大型模型诞生以来,小作坊们除了把pre-trained的模型拿过来微调一下,就束手无策了,因为成本实在是太高,实在不宜重现。而大型网络继续扩大,似乎并没有停下脚步,模型计算量的增加速度大大超过了摩尔定律 阅读全文
posted @ 2021-04-20 04:36 dagis 阅读(316) 评论(0) 推荐(0) 编辑