摘要: 提出的问题: 现有的对多智能体强化学习的评估工具没有将多智能体强化学习泛化的新情况评估作为主要目标。 传统的监督学习和受益于明确的实验环境和存在的评价基准,能够较为简单的进行评估,但是对于强化学习来说,生成一组测试环境比标记一组测试数据所需要的资源消耗是要更多的。 解决方案及创新: 提出了名为Mel 阅读全文
posted @ 2022-11-03 23:41 lanthanume 阅读(62) 评论(0) 推荐(0) 编辑
摘要: 背景: ​ 现有的多智能体强化学习都是从单智能体强化学习发展而来的,其中智能体奖励都是由环境定义。在此基础上,文章提出了一种智能体之间的奖励机制,期望其能够对学习过程有所帮助,并优化训练过程,文章证明了这种机制可以改善资源占用环境中的学习进度,并对学习过程进行了分析。 创新点: ​ 在现有的多智能体 阅读全文
posted @ 2022-11-03 15:30 lanthanume 阅读(55) 评论(0) 推荐(0) 编辑
摘要: 背景: 主要是研究在复杂的时间和空间扩展下的社会困境问题。现有的基于经济的无状态模型以及多智能体的强化学习都无法产生一个像人类一样在社会困境中合作的智能体,因此本文提及在这样的情况下促进将人类个体的对不公平厌恶特性应用于矩阵博弈社会困境问题中,并将其延伸至马尔科夫博弈问题中。 提出的问题: 在社会困 阅读全文
posted @ 2022-10-20 12:35 lanthanume 阅读(52) 评论(0) 推荐(0) 编辑
摘要: 个人总结 这个作业属于哪个课程 https://edu.cnblogs.com/campus/fzu/SE2020 这个作业要求在哪里 https://edu.cnblogs.com/campus/fzu/SE2020/homework/11605 这个作业的目标 总结本学期软工实践课程 学号 04 阅读全文
posted @ 2020-12-13 17:53 lanthanume 阅读(82) 评论(0) 推荐(0) 编辑
摘要: ##学术家庭树的前端实现 GitHub仓库地址 结对伙伴博客地址 | 这个作业属于哪个课程 | https://edu.cnblogs.com/campus/fzu/SE2020 | | : : |: : | | 这个作业要求在哪里| https://edu.cnblogs.com/campus/f 阅读全文
posted @ 2020-10-11 14:49 lanthanume 阅读(189) 评论(0) 推荐(0) 编辑
摘要: ##Fzuer Social 这个作业属于哪个课程 https://edu.cnblogs.com/campus/fzu/SE2020 这个作业要求在哪里 https://edu.cnblogs.com/campus/fzu/SE2020/homework/11224 这个作业的目标 <学习使用模型 阅读全文
posted @ 2020-09-28 23:18 lanthanume 阅读(157) 评论(2) 推荐(0) 编辑
摘要: 这个作业属于哪个课程 https://edu.cnblogs.com/campus/fzu/SE2020 这个作业要求在哪里 https://edu.cnblogs.com/campus/fzu/SE2020/homework/11167 这个作业的目标 <学习json的提取以及文件的读取写入,学会 阅读全文
posted @ 2020-09-16 17:46 lanthanume 阅读(123) 评论(1) 推荐(0) 编辑