摘要:
Tracking The Untrackable: Learning to Track Multiple Cues with Long-Term Dependencies 跟踪不可跟踪:学习跟踪具有长期依赖性的多个线索 摘要: 多目标跟踪(MTT)问题的大多数现有解决方案并未在长时间内以连贯的端到端 阅读全文
摘要:
一篇IEEE2016论文,发表于ISBI,属于生物医学领域。
论文主要思路是:首先产生大量的cell proposals,然后创建了一个表示不同细胞事件的graph,然后迭代地在这个graph中找到最可能的路径,提供细胞分割和跟踪。这里没有把segmentation与tracking分离。 阅读全文
摘要:
翻译--近年来,实时策略游戏一直是游戏人工智能的重要领域。本文提出了一个强化学习和课程转换学习方法来控制星际争霸微操作中的多个单位。我们定义了一个有效的状态表示,它可以打破游戏环境中大型状态空间造成的复杂性。然后提出了parameter sharing multi-agent gradient descent Sarsa(λ)(PS-MAGDS)算法来训练单元。我们的单位共享the learning policy,以鼓励合作行为。我们使用神经网络作为函数逼近器来估计动作值函数,并提出奖励函数来帮助单位平衡他们的移动和攻击。此外,还使用转移学习方法将我们的模型扩展到更难的场景,从而加速培训过程并提高学习效果。在小规模情景中,我们的单位成功学会以100%的胜率战胜并击败内置的AI。在大规模情景中,课程转移学习方法用于逐步培训一组单位,并且在目标情景中显示出超过某些基准方法的优越性能。通过强化学习和课程转移学习,我们的单位能够在星际争霸微观管理情景中学习适当的策略。 阅读全文
摘要:
(缺少一些公式的图或者效果图,评论区有惊喜) (个人学习这篇论文时进行的翻译【谷歌翻译,你懂的】,如有侵权等,请告知) Multiagent Bidirectionally-Coordinated Nets Emergence of Human-level Coordination in Learn 阅读全文