摘要: transformer Encoder 之前的Self-attention其实已经提到过transformer,而且transformer和后面的bert也有很大关系,transformer就是一个sequence to sequence的model 这些都是输出不定长的例子,语音识别+机器翻译=语 阅读全文
posted @ 2024-09-14 20:15 计算机飞翔 阅读(17) 评论(0) 推荐(0) 编辑