摘要: 目录概Mamba代码 Gu A. and Dao T. Mamba: Linear-time sequence modeling with selective state spaces. 2023. 概 Mamba. Mamba S4 和 S4D 虽然解决了 SSM 计算速度的问题, 但是有一个前提 阅读全文
posted @ 2024-06-12 20:31 馒头and花卷 阅读(29) 评论(0) 推荐(0) 编辑
摘要: 目录概H3代码 Fu D. Y., Dao T., Saab K. K., Thomas A. W., Rudra A. and Re C. Hungry hungry hippos: towards language modeling with state space models. 2022. 阅读全文
posted @ 2024-06-12 17:23 馒头and花卷 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 目录概符号说明S4D代码 Gu A., Gupta A., Goel K. and Re C. On the parameterization and initialization of diagonal state space models. NeurIPS, 2022. 概 Mamba 系列第四 阅读全文
posted @ 2024-06-12 14:40 馒头and花卷 阅读(37) 评论(0) 推荐(1) 编辑
摘要: 目录概符号说明S4代码 Gu A., Goel K. and Re C. Efficiently modeling long sequences with structured state spaces. NeurIPS, 2022. 概 Mamba 系列第三作. 符号说明 \(u(t) \in \ 阅读全文
posted @ 2024-06-12 10:26 馒头and花卷 阅读(60) 评论(0) 推荐(0) 编辑