摘要: 首先,什么是多模态,自然界中视觉、听觉、嗅觉、味觉、触觉、文字等都是表示物体的一种模态信息。我们大脑中也有对不同模态信息的感受区域。 那什么是多模态学习?我的理解是通过大脑中不同模态的感受器,获取多模态信息,再由大脑中的决策区域,学习实现识别、理解、甚至推理、表达、行动等操作。 Baltrušait 阅读全文
posted @ 2022-11-13 22:22 沐沐mu 阅读(307) 评论(0) 推荐(0) 编辑
摘要: 必看:https://colah.github.io/posts/2015-08-Understanding-LSTMs/ RNN(Recurrent) 前馈神经网络:https://www.cnblogs.com/mumuzeze/p/16883851.html 前馈网络的输入\(x_1,x_2, 阅读全文
posted @ 2022-11-13 15:20 沐沐mu 阅读(24) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2022-11-13 14:29 沐沐mu 阅读(12) 评论(0) 推荐(0) 编辑