【五期伍捷威】CCF-A(AAAI'20)Federated Learning for Vision-and-Language Grounding Problems
本论文提出了一种联邦学习框架,可以从不同的任务中获得各种类型的图像表示,然后将它们融合在一起以形成细粒度的图像表示。这些图像表示融合了来自不同视觉和语言的多模态问题的有用图像表示,因此在单个任务中比单独的原始图像表示强大得多。为了学习这种图像表示,提出了AimNet包含有对齐(Aligning),集成(Integrating)和映射(Mapping)。Li, Li, et al. "A review of applications in federated learning." Computers & Industrial Engineering 149 (2020): 106854.CCF-A(AAAI'20)
论文优势:1.利用联邦学习解决(为提升性能而)共享下流数据所造成的隐私问题 2.提出aimNet,将提取的图像视觉和文本特征有效地、自动地转换为细粒度的图像表示
2022年11月25日