连接
摘要: RNN:难以并行 CNN:filter只能考虑局部的信息,要叠多层 Self-attention:可以考虑全局的信息,并且可以并行 (Attention Is All You Need) 示意图:x1, x2, x3, x4先embedding成a1, a2, a3, a4,然后输入到Self-At 阅读全文
posted @ 2019-12-04 02:24 朱群喜_QQ囍_海疯习习 阅读(945) 评论(0) 推荐(0) 编辑
Map